Clasificación y generalización de formas verbales en sistemas de traducción estocástica

Adrià de Gispert; José Bernardo Mariño Acebal; Josep Maria Crego

Ayuda

Clasificación y generalización de formas verbales en sistemas de traducción estocástica

Autores: Adrià de Gispert, José Bernardo Mariño Acebal, Josep Maria Crego
Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 35, 2005, págs. 335-342
Idioma: inglés
Enlaces
- Texto completo
Resumen
- español
  En esta comunicación se propone un método para incorporar conocimiento lingüístico relativo a las formas verbales en sistemas estocásticos de traducción. Por medio de una clasificación basada en conocimiento de dichas formas, y de su sustitución por el lema del verbo principal durante la fase de entrenamiento, se consigue un mejor alineado en palabras, cuya consecuencia es una mejor estimación del modelo de traducción. Además, a partir de las formas verbales observadas en el entrenamiento es posible generalizar con éxito y proporcionar traducciones a nuevas formas no vistas anteriormente. El método propuesto es evaluado en una tarea de traducción del inglés al español de dominio restringido, donde se alcanza una mejora signifocativa
- English
  This paper introduces a method to incorporate linguistic knowledge regarding verb forms into an stochastic machine translation model. By means of a rule-based classification of these forms, and by substituting them by the base form of the head verb during the training stage, we achieve a better statistical word alignment, which leads to a better estimate of the translation model. Furthermore, a successful generalization strategy can be devised to produce a new translation for unseen verb forms from the translations of seen verb forms. An evaluation of this method in an English to Spanish limited-domain translation task is presented, producing a significant performance improvement

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: