Oferta de tesis Doctorado en Informática

Ir a contenido Ir a Estudios, Gobernanza y organización
Logo UA
Realizar búsqueda
Menú
Otros sitios
  Doctorado en Informática
Doctorado en Informática

Oferta de tesis

En este apartado iremos mostrando algunos posibles proyectos de tesis propuestos por los investigadores del programa de doctorado. El estudiante interesado puede contactar directamente con el investigador.

  • Profesor: Felipe Sánchez-Martínez (fsanchez@dlsi.ua.es)
    Línea de investigación: Traducción automática, bibliotecas digitales y educación asistida por ordenador
    Título del proyecto: Técnicas de hibridación para sistemas jerárquicos de traducción automática estadística
    Descripción: El método de traducción automática de mayor aplicación hoy en día es el de la traducción automática estadística. Hay dos tipos de sistemas de traducción automática estadística que no utilicen ninguna información lingüística de forma explícita: los sistemas tradicionales basados %u200B%u200Ben segmentos bilingües que utilizan unidades de traducción a nivel de segmento para la traducción, y los sistemas jerárquicos que utilizan gramáticas probabilísticas síncronas independientes del contexto, es decir, utilizan unidades de traducción basadas %u200B%u200Ben árboles. Ambos tipos de sistemas de traducción automática estadística se pueden construir con poco o ningún esfuerzo humano cuando hay disponibles grandes cantidades de corpus paralelo. Sin embargo, la cantidad de corpus paralelos necesaria para alcanzar resultados acordes con el estado de la cuestión no siempre está disponible. Como resultado, los sistemas de traducción automática basados en reglas se siguen desarrollando de forma activa, en especial para idiomas con pocos recursos, ya que no dependen de corpus paralelos sino que se basan en representaciones explícitas de información lingüística tales como léxicos bilingües y reglas de transferencia estructural (transformación gramatical). Durante los últimos años se han desarrollado diversos enfoques híbridos que se aprovechan de los dos paradigmas de traducción automática para mejorar la calidad de las traducciones que producen, con especial atención a la hibridación de sistemas basados %u200B%u200Ben reglas y sistemas de traducción automática estadística basados en segmentos bilingües. El director de este proyecto de tesis ha dirigido recientemente una tesis sobre la inferencia automática de reglas de transferencia estructural para la traducción basada en reglas y su integración en sistemas de traducción automática estadística basados en segmentos bilingües. El objetivo de esta tesis es explorar la inferencia de reglas de transferencia estructural adecuadas para su integración en sistemas jerárquicos de traducción automática estadística y explorar nuevos enfoques híbridos para la integración de recursos lingüísticos explícitos ---léxicos bilingües y reglas de transferencia estructural--- en sistemas jerárquicos de traducción automática estadística.

  • Profesor: Mikel L. Forcada y Felipe Sánchez-Martínez email: mlf@ua.es, fsanchez@dlsi.ua.es
    Línea de investigación: Traducción automática, bibliotecas digitales y educación asistida por ordenador.
    Título del proyecto: Postedición automática de la traducción automática independiente de la tecnología.
    Descripción: Los resultados de la traducción automática normalmente necesitan ser posteditados (corregidos por profesionales de la traducción) para hacerlos adecuados a un determinado propósito comunicativo. Cuando los textos pertenecen a un dominio específico, es posible automatizar parcialmente el proceso de postedición (y por lo tanto, reducir el esfuerzo) mediante la llamada 'postedición automática'. La postedición automática se puede aprender a partir del trabajo de postedición profesional. Hasta ahora, este aprendizaje se ha hecho usando sistemas de traducción automática estadística relativamente complejos, que se tienen que entrenar con muchos datos de postedición. El objetivo de esta tesis es explorar la posibilidad de aprender, usando el propio sistema de traducción automática existente, e independientemente de cuál sea su funcionamiento, un método ligero de postedición automática que pueda ser implementado fácilmente en entornos de traducción asistida y que aprenda del trabajo de los profesionales.

  • Profesor: Mikel L. Forcada y Felipe Sánchez-Martínez email: mlf@ua.es, fsanchez@dlsi.ua.es
    Línea de investigación: Traducción automática, bibliotecas digitales y educación asistida por ordenador
    Título del proyecto: Estandarización y estrategias del proceso de recolección de corpus paralelos de Internet.
    Descripción: Recientemente se ha generalizado el uso de métodos que recolectan corpus paralelos de Internet. Estos corpus pueden ser usados como memorias de traducción en la traducción (profesional) asistida por ordenador o para entrenar sistemas de traducción automática estadística (el ejemplo más conocido es el traductor de Google). Hay varias herramientas libres, como por ejemplo Bitextor o ILSP Focussed Crawler, las cuales, como resultado de estrategias diferentes en cuanto a
    (a) como organizar la exploración y seguir los enlaces;
    (b) como decidir si dos documentos recolectados son traducción mutua, y
    (c) como segmentar y alinear estos segmentos, producen resultados completamente diferentes.
    Se hace necesaria una formalización teórica de estos tres procesos (exploración, emparejamiento, y alineación) que permita, por un lado, describir en términos abstractos (y con capacidad de predecir el comportamiento) las implementaciones existentes, y de otra, definir implementaciones de referencia de estrategias de éxito.

  • Profesor: Mikel L. Forcada y Felipe Sánchez-Martínez email: mlf@ua.es, fsanchez@dlsi.ua.es
    Línea de investigación: Traducción automática, bibliotecas digitales y educación asistida por ordenador
    Título del proyecto: Uso del esfuerzo de postedición para guiar la optimización y la selección de fuentes de asistencia de traducción.
    Descripción: Por un lado, la evaluación y la optimización de fuentes de asistencia de traducción como por ejemplo la traducción automática se hace actualmente usando medidas de evaluación automática que no pueden asegurar la reducción del esfuerzo de postedición. Por otro lado, los métodos actuales para estimar la calidad de la salida de estas fuentes no pueden ser usados fácilmente para todo tipo de fuentes y por eso no se pueden usar para seleccionar la mejor fuente para cada segmento. Los directores han definido un marco general para la medida y la estimación del esfuerzo de postedición en el cual las fuentes de asistencia a la traducción pueden ser tanto optimizadas como combinadas de manera consistente, de forma que los traductores profesionales se beneficien de la integración sin fisuras de todas las tecnologías a su alcance cuando ejecutan un trabajo de traducción. El objetivo de esta tesis es integrar los resultados existentes en evaluación automática, estimación de la calidad, y selección de fuentes de la asistencia en este marco y realizar y probar implementaciones de referencia completas en escenarios de traducción del mundo real.

  • Profesor: Mikel L. Forcada email: mlf@ua.es
    Línea de investigación: Traducción automática, bibliotecas digitales y educación asistida por ordenador
    Título del proyecto: Efecto de las directrices para la alineación manual de palabras sobre la extracción de pares de frases mediante alineadores aprendidos de manera discriminativa.
    Descripción: Las técnicas actuales de traducción automática estadística están basadas en el concepto de pares de frases (segmentos de más de una palabra). Estos pares de frases son extraídos de corpus paralelos alineados oración a oración utilizando alineadores automáticos de palabras. Una manera en que se pueden aprender alineadores de palabras es a través del aprendizaje discriminativo supervisado a partir de corpus paralelos donde se ha hecho manualmente el alineamiento de palabras. El alineamiento manual de las palabras se hace normalmente siguiendo directrices explícitas que dictan cuando dos palabras tendrían que ser alineadas, pero puede haber más de una manera de formular estas directrices, puesto que no hay ninguna manera única acordada de representar la equivalencia de traducción a través del alineamiento de palabras. Esta tesis explora el efecto de las directrices usadas en la calidad de los pares de frase extraídos y de la traducción automática que en resulta.

  • Profesor: Juan Ramón Rico email: JuanRamonRico@ua.es
    Línea de investigación: Reconocimiento de formas, aprendizaje automático
    Título del proyecto: Estudio de medidas empíricas de calidad del aprendizaje de sistemas on-line.
    Descripción: Existen diversos sistemas de aprendizaje basados en modelos incrementales o adaptativos (requieren poco coste computacional para actualizar el modelo predictivo) que funcionan con una tasa de aciertos aceptable cuando tienen un número suficiente de ejemplos para ello. Una nueva aproximación sería estudiar la evolución de la calidad de los prototipos en los que se basa el modelo para:
    - poder cuantificar cuan válidas son las predicciones por clase en cada instante;
    - evitar aprender prototipos innadecuados (ruido);
    - poder corregir o adecuar mejor las decisiones finales del modelo.

  • Profesor: Sergio Luján email: sergio.lujan@ua.es
    Línea de investigación: Traducción automática, bibliotecas digitales y educación asistida por ordenador
    Título del proyecto: Desarrollo de un sistema de valoración de recursos educativos abiertos para ayudar a la localización de recursos de alta calidad
    Descripción: Los recursos educativos abiertos (REA) son materiales educativos publicados con licencias de acceso libre y por lo general bajo licencia abierta que permiten la reutilización. En la actualidad existe un gran volumen de REA publicados en la Web, pero no existe un mecanismo que permita conocer su calidad.
    En este trabajo se propone desarrollar un sistema que permita de una forma sencilla valor los REA por parte de sus usuarios. Inicialmente, se tendrá que estudiar la viabilidad de diferentes soluciones (análisis de comentarios, colaboración abierta distribuida o crowdsourcing, estadísticas de descarga y uso, etc.) para adoptar la técnica más adecuada. A continuación se tendrá que desarrollar un modelo y un prototipo que demuestre su funcionamiento.

  • Profesor: Sergio Luján email: sergio.lujan@ua.es
    Línea de investigación: Traducción automática, bibliotecas digitales y educación asistida por ordenador
    Título del proyecto: Aplicación de la web semántica para mejorar la localización de información educativa
    Descripción: Un microformato es una forma simple de agregar semántica a un contenido que es legible por un humano mientras que para un sistema informático puede ser sólo texto plano. Los microformatos forman parte de la web semántica, la base de la Web 3.0. Los microformatos se han aplicado a varios dominios, como a las recetas de cocina, a las opiniones sobre películas y libros, y a las empresas y organizaciones. Sin embargo, no se han aplicado al dominio educativo.
    En este trabajo se propone estudiar la aplicabilidad de los microformatos existentes en la actualidad al dominio educativo (por ejemplo, para agregar información semántica a la publicación de anuncios de cursos o la publicación de recursos educativos) y el desarrollo de nuevos microformatos para suplir las carencias de los microformatos actuales.

  • Profesor: Sergio Luján email: sergio.lujan@ua.es
    Línea de investigación: Ingeniería del Software, Ingeniería Web e Inteligencia de Negocio
    Título del proyecto: Desarrollo de heurísticas para la evaluación de la accesibilidad web
    Descripción: La accesibilidad web tiene como objetivo lograr que las páginas web sean utilizables por el máximo número de personas, independientemente de sus conocimientos o capacidades personales e independientemente de las características técnicas del equipo utilizado para acceder a la Web. En la actualidad, existen diferentes guías que marcan cómo se deben crear las páginas web para que sean accesibles. Desgraciadamente, estas guías no recogen todos los problemas de accesibilidad que existen. Además, su verificación automática no es muy precisa, por lo que se han desarrollado heurísticas que complementan las guías de accesibilidad. En esta tesis se propone investigar en las heurísticas que existen en la actualidad para la evaluación de la accesibilidad web con el fin de desarrollar un conjunto de nuevas heurísticas que complementen a las existentes y tengan en cuenta los últimos avances tecnológicos.

  • Profesor: Sergio Luján email: sergio.lujan@ua.es
    Línea de investigación: Ingeniería del Software, Ingeniería Web e Inteligencia de Negocio
    Título del proyecto: Análisis del nivel de aplicación de la accesibilidad web en la actualidad
    Descripción: La accesibilidad web tiene como objetivo lograr que las páginas web sean utilizables por el máximo número de personas, independientemente de sus conocimientos o capacidades personales e independientemente de las características técnicas del equipo utilizado para acceder a la Web. En la mayoría de los países del "primer mundo" existen leyes que obligan a que los sitios web de las administraciones públicas (gobierno, ministerios, ayuntamientos, universidades, etc.) sean accesibles. Sin embargo, su grado de cumplimiento es muy desigual. En esta tesis se propone analizar cuál es el nivel de aplicación de la guías de accesibilidad web entre aquellos organismos que deben cumplirla por ley. El objetivo del trabajo es desarrollar métodos que permitan un análisis automático de los sitios web de diferentes países para obtener como resultado final un informe de evaluación que muestre la situación actual de la accesibilidad web.