Oferta de tesi Doctorat en Informàtica

Ir a contenido Ir a Estudios, Gobernanza y organización
Logo UA
Realizar búsqueda
Menú
Altres llocs
Logo Doctorat en Informàtica   Doctorat en Informàtica
Doctorat en Informàtica

Oferta de tesi

En aquest apartat anirem mostrant alguns possibles projectes de tesis proposats pels investigadors del programa de doctorat. L'estudiant interessat pot contactar directament amb l'investigador.

  • Profesor: Felipe Sánchez-Martínez (fsanchez@dlsi.ua.es)
    Línia d'investigació:  Traducció automàtica, biblioteques digitals i educació assistida per ordinador
    Títol del projecte: Tècniques d'hibridació per a sistemes jeràrquics de traducció automàtica estadística
    Descripció: El mètode de traducció automàtica de major aplicació hui dia és el de la traducció automàtica estadística. Hi ha dos tipus de sistemes de traducció automàtica estadística que no utilitzen cap informació lingüística de forma explícita: els sistemes tradicionals basats %u200B%u200Ben segments bilingües que utilitzen unitats de traducció a nivell de segment per a la traducció, i els sistemes jeràrquics que utilitzen gramàtiques probabilístiques síncrones independents del context, és a dir, utilitzen unitats de traducció basades %u200B%u200Ben arbres. Tots dos tipus de sistemes de traducció automàtica estadística es poden construir amb poc o cap esforç humà quan hi ha disponibles grans quantitats de corpus paral·lel. No obstant açò, la quantitat de corpus paral·lel necessària per a aconseguir resultats  el línia amb l'estat de la qüestió no sempre està disponible. Com a resultat, els sistemes de traducció automàtica basats en regles se segueixen desenvolupant de forma activa, especialment per a idiomes amb pocs recursos, ja que no depenen de corpus paral·lels sinó que es basen en representacions explícites d'informació lingüística tals com lèxics bilingües i regles de transferència estructural (transformació gramatical). Durant els últims anys s'han desenvolupat diversos enfocaments híbrids que s'aprofiten dels dos paradigmes de traducció automàtica per a millorar la qualitat de les traduccions que produeixen, amb especial atenció a la hibridació de  sistemes basats %u200B%u200Ben regles i sistemes de traducció automàtica estadística basats en segments bilingües. El director d'aquest projecte de tesi ha dirigit recentment una tesi sobre la inferència automàtica de regles de transferència estructural per a la traducció basada en regles i la seua integració en sistemes de traducció automàtica estadística basats en segments bilingües. L'objectiu d'aquesta tesi és explorar la inferència de regles de transferència estructural adequades per a la seua integració en sistemes jeràrquics de traducció automàtica estadística i explorar nous enfocaments híbrids per a la integració de recursos lingüístics explícits ---lèxics bilingües i regles de transferència estructural--- en sistemes jeràrquics de traducció automàtica estadística.

  • Professor: Mikel L. Forcada i Felipe Sánchez-Martínez email: mlf@ua.es, fsanchez@dlsi.ua.es
    Línia de investigació: Traducció automàtica, biblioteques digitals i educació assistida per ordinador
    Títol del projecte: Postedició automàtica de la traducció automàtica independent de la tecnologia
    Descripció: Els resultats de la traducció automàtica normalment necessiten ser posteditats (corregits per professionals de la traducció) per a fer-los adequats a un determinat propòsit comunicatiu. Quan els textos pertanyen a un domini específic, és possible automatitzar parcialment el procés de postedició (i per tant, reduir l'esforç) mitjançant l'anomenada 'postedició automàtica'. La postedició automàtica es pot aprendre a partir del treball de postedició professional. Fins ara, aquest aprenentatge s'ha fet usant sistemes de traducció automàtica estadística relativament complexos, que s'han d'entrenar amb moltes dades de postedició. L'objectiu d'aquesta tesi és explorar la possibilitat d'aprendre, usant el propi sistema de traducció automàtica existent, i independentment de quin siga el seu funcionament, un mètode lleuger de postedició automàtica que puga ser implementat fàcilment en entorns de traducció assistida i que aprenga del treball dels professionals.

  • Professor: Mikel L. Forcada i Felipe Sánchez-Martínez email: mlf@ua.es, fsanchez@dlsi.ua.es
    Línia de investigació: Traducció automàtica, biblioteques digitals i educació assistida per ordinador
    Títol del projecte: Estandardització i estratègies del procés de recol·lecció de corpus paral·lels d'Internet
    Descripció: Recentment s'ha generalitzat l'ús de mètodes que recol·lecten corpus paral·lels d'Internet. Aquests corpus poden ser usats com a memòries de traducció en la traducció (professional) assistida per ordinador o per a entrenar sistemes de traducció automàtica estadística (l'exemple més conegut és el traductor de Google). Hi ha diverses eines lliures, com ara Bitextor o ILSP Focussed Crawler, les quals, com a resultat d'estratègies diferents quant a
    (a) com organitzar l'exploració i resseguir els enllaços;
    (b) com decidir si dos documents recol·lectats són traducció mútua, i
    (c) com segmentar i alinear aquests segments, produeixen resultats completament diferents.
    Es fa necessària una formalització teòrica d'aquests tres processos (exploració, aparellament, i alineació) que permeta, d'una banda, descriure en termes abstractes (i amb capacitat de predir-ne el comportament) les implementacions existents, i d'altra, definir implementacions de referència d'estratègies d'èxit.

  • Professor: Mikel L. Forcada i Felipe Sánchez-Martínez email: mlf@ua.es, fsanchez@dlsi.ua.es
    Línia de investigació: Traducció automàtica, biblioteques digitals i educació assistida per ordinador
    Títol del projecte: Ús de l'esforç de postedició per a guiar l'optimització i la selecció de fonts d'assistència de traducció.
    Descripció: Per una banda, l'avaluació i l'optimització de fonts d'assistència de traducció com ara la traducció automàtica es fa actualment usant mesures d'avaluació automàtica que no poden assegurar la reducció de l'esforç de postedició. D'altra banda, els mètodes actuals per a estimar la qualitat de la sortida d'aquestes fonts no poden ser usats fàcilment per a tot tipus de fonts i per això no es poden usar per a seleccionar la millor font per a cada segment. Els directors han definit un marc general per a la mesura i l'estimació de l'esforç de postedició en el qual les fonts d'assistència a la traducció poden ser tant optimitzades com combinades de manera consistent, de manera que els traductors professionals es beneficien de la integració sense fissures de totes les tecnologies a la seua disposició quan fan un treball de traducció. L'objectiu d'aquesta tesi és integrar els resultats existents en avaluació automàtica, estimació de la qualitat, i selecció de fonts de l'assistència a aquest marc i realitzar i provar implementacions de referència completes en escenaris de traducció del món real.

  • Professor: Mikel L. Forcada email: mlf@ua.es
    Línia de investigació: Traducció automàtica, biblioteques digitals i educació assistida per ordinador
    Títol del projecte: Efecte de les directrius per a l'alineació manual de mots sobre l'extracció de parells de frases mitjançant alineadors apresos de manera discriminativa.
    Descripció: Les tècniques actuals de traducció automàtica estadística estan basades en el concepte de parells de frases (segments de més d'un mot). Aquests parells de frases són extrets de corpus paral·lels alineats oració a oració utilitzant alineadors automàtics de mots. Una manera en què es poden aprendre alineadors de mots és a través de l'aprenentatge discriminatiu supervisat a partir de corpus paral·lels on s'ha fet manualment l'alineament de mots. L'alineament manual dels mots es fa normalment seguint directrius explícites que dicten quan dos mots haurien de ser alineats, però hi pot haver més d'una manera de formular aquestes directrius, ja que no hi ha cap manera única acordada de representar l'equivalència de traducció a través de l'alineament de mots. Aquesta tesi explora l'efecte de les directrius usades en la qualitat dels parells de frase extrets i de la traducció automàtica que en resulta.

  • Professor: Juan Ramón Rico email: Juanramonrico@ua.es
    Línia de recerca: Reconeixement de formes, aprenentatge automàtic
    Títol del projecte: Estudi de mesures empíriques de qualitat de l'aprenentatge de sistemes on-line.
    Descripció: Existeixen diversos sistemes d'aprenentatge basats en models incrementals o adaptatius (requereixen poc cost computacional per a actualitzar el model predictiu) que funcionen amb una taxa d'encerts acceptable quan tenen un nombre suficient d'exemples per a açò. Una nova aproximació seria estudiar l'evolució de la qualitat dels prototips en els quals es basa el model para:
    - poder quantificar cuan vàlides són les prediccions per classe en cada instant;
    - evitar aprendre prototips innadecuados (soroll);
    - poder corregir o adequar millor les decisions finals del model.

  • Professor: Sergio Luján email: sergio.lujan@ua.es
    Línia de recerca: Traducció automàtica, biblioteques digitals i educació assistida per ordinador
    Títol del projecte: Desenvolupament d'un sistema de valoració de recursos educatius oberts per a ajudar a la localització de recursos d'alta qualitat
    Descripció: Els recursos educatius oberts (REVA) són materials educatius publicats amb llicències d'accés lliure i en general sota llicència oberta que permeten la reutilització. En l'actualitat existeix un gran volum de REVA publicats en la Web, però no existeix un mecanisme que permeta conèixer la seua qualitat.
    En aquest treball es proposa desenvolupar un sistema que permeta d'una forma senzilla valor els REVA per part dels seus usuaris. Inicialment, s'haurà d'estudiar la viabilitat de diferents solucions (anàlisis de comentaris, col·laboració oberta distribuïda o crowdsourcing, estadístiques de descàrrega i ús, etc.) per a adoptar la tècnica més adequada. A continuació s'haurà de desenvolupar un model i un prototip que demostre el seu funcionament.

  • Professor: Sergio Luján email: sergio.lujan@ua.es
    Línia de recerca: Traducció automàtica, biblioteques digitals i educació assistida per ordinador
    Títol del projecte: Aplicació de la web semàntica per a millorar la localització d'informació educativa
    Descripció: Un microformato és una forma simple d'agregar semàntica a un contingut que és llegible per un humà mentre que per a un sistema informàtic pot ser només text pla. Els microformatos formen part de la web semàntica, la base de la Web 3.0. Els microformatos s'han aplicat a diversos dominis, com a les receptes de cuina, a les opinions sobre pel·lícules i llibres, i a les empreses i organitzacions. No obstant açò, no s'han aplicat al domini educatiu.
    En aquest treball es proposa estudiar l'aplicabilitat dels microformatos existents en l'actualitat al domini educatiu (per exemple, per a agregar informació semàntica a la publicació d'anuncis de cursos o la publicació de recursos educatius) i el desenvolupament de nous microformatos per a suplir les manques dels microformatos actuals.

  • Professor: Sergio Luján email: sergio.lujan@ua.es
    Línia de recerca: Enginyeria del Programari, Enginyeria Web i Intel·ligència de Negoci
    Títol del projecte: Desenvolupament d'heurístiques per a l'avaluació de l'accessibilitat web
    Descripció: L'accessibilitat web té com a objectiu aconseguir que les pàgines web siguen utilitzables pel màxim nombre de persones, independentment dels seus coneixements o capacitats personals i independentment de les característiques tècniques de l'equip utilitzat per a accedir a la Web. En l'actualitat, existeixen diferents guies que marquen com s'han de crear les pàgines web perquè siguen accessibles. Desgraciadament, aquestes guies no arrepleguen tots els problemes d'accessibilitat que existeixen. A més, la seua verificació automàtica no és molt precisa, per la qual cosa s'han desenvolupat heurístiques que complementen les guies d'accessibilitat. En aquesta tesi es proposa investigar en les heurístiques que existeixen en l'actualitat per a l'avaluació de l'accessibilitat web amb la finalitat de desenvolupar un conjunt de noves heurístiques que complementen a les existents i tinguen en compte els últims avanços tecnològics.

  • Professor: Sergio Luján email: sergio.lujan@ua.es
    Línia de recerca: Enginyeria del Programari, Enginyeria Web i Intel·ligència de Negoci
    Títol del projecte: Anàlisi del nivell d'aplicació de l'accessibilitat web en l'actualitat
    Descripció: L'accessibilitat web té com a objectiu aconseguir que les pàgines web siguen utilitzables pel màxim nombre de persones, independentment dels seus coneixements o capacitats personals i independentment de les característiques tècniques de l'equip utilitzat per a accedir a la Web. En la majoria dels països del "primer món" existeixen lleis que obliguen al fet que els llocs web de les administracions públiques (govern, ministeris, ajuntaments, universitats, etc.) siguen accessibles. No obstant açò, el seu grau de compliment és molt desigual. En aquesta tesi es proposa analitzar quin és el nivell d'aplicació de la guies d'accessibilitat web entre aquells organismes que han de complir-la per llei. L'objectiu del treball és desenvolupar mètodes que permeten una anàlisi automàtica dels llocs web de diferents països per a obtenir com a resultat final un informe d'avaluació que mostre la situació actual de l'accessibilitat web.