Combining statistical and finite-state methods for machine translation

David Picó Vila

Ayuda

Combining statistical and finite-state methods for machine translation

Autores: David Picó Vila
Directores de la Tesis: Francisco Casacuberta Nolla (dir. tes.)
Lectura: En la Universitat Politècnica de València ( España ) en 2005
Idioma: español
Tribunal Calificador de la Tesis: Enrique Vidal Ruiz (presid.), Joan Andreu Sánchez Peiró (secret.), Juan Miguel Vilar Torres (voc.), María Inés Torres Barañano (voc.), Diamantino Antonio Caseiro (voc.)
Materias:
- Matemáticas
  - Ciencia de los ordenadores
    - Inteligencia artificial
    - Lenguajes de programación
- Lingüística
  - Lingüística aplicada
    - Lingüística informatizada
    - Traducción automática
Texto completo no disponible (Saber más ...)
Resumen
- La traducción automática es un campo muy activo de las tecnologías del lenguaje natural que ha experimentado un fuerte desarrollo en las últimas décadas, Las técnicas que se han puesto en marcha podrían clasificarse, de manera un tanto simplista, en técnicas "basadas en el conocimiento", que utilizan información aportada por expertos lingüistas, y técnicas "basadas en ejemplos", que extraen la información automáticamente a partir de corpus de texto.
  
  El trabajo de esta tesis se enmarca en la seguna familia de técnicas, las basadas en ejemplos. Nos hemos centrado en el uso de un modelo en particular:
  
  el de los transductores estocásticos de estados finitos. Este modelo (y otros parecidos) se utiliza en muchas áreas de las tecnologías del lenguaje y con finalidades diferentes. Nosotros lo utilizamos aquí para la traducción entre lenguas distintas.
  
  La tesis aborda el problema de la creación de transductores estocásticos de estados finitos a partir de muestras de traducción. Estas muestras consisten en pares de frases en idiomas diferentes en los que una frase es traducción de la otra. Por un lado, aportamos varios algoritmos para la estimación de la parte probabilística de los transductores, sobre el supuesto de que se conoce ya la estructura. Por otro lado, y como contribución fundamental del trabajo, se expone un método y un conjunto de algoritmos para inferir transductores (con estructura y probabilidades) a partir de muestras, que agrupamos bajo las siglas genéricas de GIATI (por el inglés, Grammatical inference algorithms.
  
  Esta memoria presenta una primera exposición teórica de estos algoritmos, y continúa con un estudio práctico de implementación en el que se exploran diferentes formas de poner en uso GIATI. Se presentan también estudios experimentales de traducción que ponen de manifiesto las posibilidades reales de aplicación de estas técnicas.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: