Ayuda
Ir al contenido

Dialnet


Explotación de corpus paralelos alineados para el desarrollo de entornos de composición de documentos estructurados bilingües

  • Autores: Arantza Casillas Rubio
  • Directores de la Tesis: Iñaki Alegría Loinaz (dir. tes.), Joseba Abaitua (dir. tes.)
  • Lectura: En la Universidad de Deusto ( España ) en 2000
  • Idioma: español
  • Tribunal Calificador de la Tesis: Horacio Rodríguez Hontoria (presid.), Verónica Canivell Castillo (secret.), Lidia Moreno Boronat (voc.), José Gabriel Amores Carredano (voc.), Anselmo del Moral Bueno (voc.)
  • Materias:
  • Texto completo no disponible (Saber más ...)
  • Resumen
    • La IA(Inteligencia Artificial) es un area que abarca conocimiento de muy diverso tipo y en la que, por su naturaleza interdisciplinar, se produce la convergencia de tecnicas muy diferentes, Entre las muchas aplicaciones de la IA existe una antigua y destacada, pero que se resiste a su resolucion, es el PLN (Procesamiento del Lenguaje Natural) y dentro de ese particularmente la traduccion entre textos en diferentes idiomas. Esta tesis se enfrenta de una manera realista a este problema abordandolo en su vertiente mas viable. Tiene como principal caracteristica la convergencia de diferentes tecnicas y la puesta es practica de una manera novedosa. Concretamente esta tesis aborada el tema de la composicion de documentacion especializada multilingue. Se propone una metodologia de composicion que combina diversas areas de gran actualidad dentro del PLN como son: el tratamiento de corpus, el procesamiento de documentos estructurados, los lenguajes de etiquetado, la traduccion automatica y la generacion multilingue. Con esta metodologia se crean, a partir de un corpus alineado, recursos linguisticos, memorias de traduccion y estructuras de tipo de documento, para posteriormente utilizarlos en la composicion de documentacion similar. Para llevar a la practica la metodologia propuesta es necesario desarrollar diferentes algoritmos, algunos de ellos innovadores, tanto para el tratamiento de documentos estructurados SGML,-Standard Generalize markup Languaje- como para la manipulacion y creacion de memorias de traduccion a partir de corpus alineados. A lo largo de esta memoria se justifica que SGML, es el lenguaje de etiquetado mas apropiado para anotar documentos estructurados pertenecientes a un dominio especifico que posteriormente se vayan a utilizar como base para la composicion de documentacion similar. Para demostrar la eficacia de la metodologia propuesta se ha desarrollado un prototipo de editor bilingüe que hemos llamado BiGentor. En este edit


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno