Marta Ruiz Costa-Jussà, José Adrián Rodríguez Fonollosa
Actualmente los errores debidos al cambio de orden de las palabras son una de las principales fuentes de error en los sistemas de traducción automática estocástica (TAE) basados en frases. Esta comunicación propone una nueva estrategia estadística para afrontar los reordenamientos que denominaremos RAE (Reordenamiento automático estocástico). El método propuesto aprovecha la poderosas técnicas de aprendizaje estadístico desarrolladas en traducción estadística para traducir el lenguaje fuente (S) en un lenguaje fuente reordenado (S'), que nos permita mejorar la traducción final al lenguaje destino (T). Por lo tanto, el lenguaje fuente de la tarea de traducción en sí pasa a ser S', y esto nos permite generar un alineado más monótono entre las palabras de ambos lenguajes y unas unidades de traducción menores. Además, el uso de clases de palabras en la estrategia RAE ayuda a generalizar reordenamientos. En este artículo se presentan resultados en la tarea de ZhEn de la evaluación IWSLT05 que muestran una mejora significativa en la calidad de la traducción.
Nowadays, reordering is one of the most important problems in Statistical Machine Translation (SMT) systems. This paper exposes a novel strategy to face it: Statistical Machine Reordering (SMR). It consists of using the powerful techniques developed for Statistical Machine Translation (SMT) in order to translate the source language (S) into a reordered source language (S'), which allows for an improved translation into the target language (T). Then, the SMT task changes from S2T to S'2T which leads to a monotonized word alignment and shorter translation units. In addition, the use of classes in SMR helps to generalize word reorderings. Experiments are reported in the ZhEn IWSLT05 task showing significant improvement in translation quality.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados