Evaluación de estrategias para la traducción automática estadística de chino a castellano con el inglés como lengua pivote

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/18519
Información del item - Informació de l'item - Item information
Título: Evaluación de estrategias para la traducción automática estadística de chino a castellano con el inglés como lengua pivote
Título alternativo: Evaluating indirect strategies for Chinese-Spanish statistical machine translation with English as pivot language
Autor/es: Ruiz Costa-Jussà, Marta | Henríquez Quintana, Carlos | Banchs Martínez, Rafael Enrique
Palabras clave: Lengua china | Lengua española | Traducción automática estadística | Aproximaciones pivote | Chinese language | Spanish language | Statistical machine translation | Pivot strategies
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2011
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: COSTA-JUSSÀ, Marta R.; HENRÍQUEZ, Carlos; BANCHS, Rafael E. “Evaluación de estrategias para la traducción automática estadística de chino a castellano con el inglés como lengua pivote”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 119-126
Resumen: El chino y el castellano son los idiomas más hablados en el mundo como lenguas maternas. Sin embargo, no existe mucha actividad de investigación en traducción automática entre este par de lenguas. Este artículo se enfoca en la investigación del estado actual de la cuestión de la traducción automática estadística entre chino-castellano, ya que hoy en día constituye una de las aproximaciones más usadas dentro del área de la traducción automática. Con este propósito en mente, describimos los corpus paralelos disponibles como el BTEC (Basic Traveller Expressions Corpora), la Biblia y las Naciones Unidas (UN). Concretamente, experimentamos con diferentes estrategias de traducción automática estadística directa e indirectas (denominadas pivotes). Entre las estrategias pivotes exploramos dos metodologías: la traducción de chino a pivote y de pivote a castellano; y el sistema entrenado con un pseudo-corpus chino-castellano, en el que el castellano se ha traducido previamente del pivote. Usamos el inglés como lengua pivote. Los resultados experimentales sugieren que el inglés podría constituir una lengua óptima para la intermediación de la traducción entre chino y castellano. Así pues, uno de los principales objetivos de este trabajo es motivar a la comunidad científica para investigar en este par de lenguas de alto impacto demográfico. | Chinese and Spanish are the most spoken languages in the world. However, there is not much research done in machine translation for this language pair. This paper focuses on investigating the state-of-the-art of Chinese-Spanish Statistical Machine Translation, which nowadays is one of the more popular approaches in Machine Translation. For this purposes we report the details of the available parallel corpus which are the BTEC (Basic Traveller Expressions Corpora), Holy Bible and UN (United Nations). Additionally, we experiment with the biggest corpus (UN) to explore alternatives of SMT strategies which consist on using a pivot language. Two alternatives are shown for pivoting: translating from Chinese to Pivot and from Pivot to Spanish; and training on a Chinese-Spanish corpus, where the Spanish corpus has been previously translated from the Pivot language. We use English as Pivot language. Results show that English is quite a nice pivot language between Chinese and Spanish. One of the main objectives of this work is motivating and involving the research community to work in this important pair of languages given the demographic impact of these two languages.
Patrocinador/es: Este trabajo ha sido parcialmente financiado por el Ministerio de Ciencia e Innovación mediante un programa Juan de la Cierva y el proyecto BUCEADOR (TEC2009-14094-C04-01).
URI: http://hdl.handle.net/10045/18519
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 47 (2011)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_47_12.pdf344,56 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.