Clasificación y generalización de formas verbales en sistemas de traducción estocástica
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/1332
Título: | Clasificación y generalización de formas verbales en sistemas de traducción estocástica |
---|---|
Autor/es: | Gispert Ramis, Adrià de | Mariño Acebal, José Bernardo | Crego Clemente, Josep María |
Palabras clave: | Traducción estocástica | Conocimiento lingüístico | Formas verbales | Morfología | Stochastic machine translation | Linguistic knowledge | Verb forms | Morphology |
Fecha de publicación: | sep-2005 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | GISPERT RAMIS, Adrià de; MARIÑO ACEBAL, José Bernardo; CREGO CLEMENTE, Josep María. “Clasificación y generalización de formas verbales en sistemas de traducción estocástica”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 335-342 |
Resumen: | En esta comunicación se propone un método para incorporar conocimiento lingüístico relativo a las formas verbales en sistemas estocásticos de traducción. Por medio de una clasificación basada en conocimiento de dichas formas, y de su sustitución por el lema del verbo principal durante la fase de entrenamiento, se consigue un mejor alineado en palabras, cuya consecuencia es una mejor estimación del modelo de traducción. Además, a partir de las formas verbales observadas en el entrenamiento es posible generalizar con éxito y proporcionar traducciones a nuevas formas no vistas anteriormente. El método propuesto es evaluado en una tarea de traducción del inglés al español de dominio restringido, donde se alcanza una mejora significativa. | This paper introduces a method to incorporate linguistic knowledge regarding verb forms into an stochastic machine translation model. By means of a rule-based classification of these forms, and by substituting them by the base form of the head verb during the training stage, we achieve a better statistical word alignment, which leads to a better estimate of the translation model. Furthermore, a successful generalization strategy can be devised to produce a new translation for unseen verb forms from the translations of seen verb forms. An evaluation of this method in an English to Spanish limited-domain translation task is presented, producing a significant performance improvement. |
Patrocinador/es: | Este trabajo ha sido financiado parcialmente por la CICYT a través del proyecto TIC2002-04447-C02 (ALIADO), la Unión Europea mediante el proyecto FP6-506738 (TC-STAR), y el "Departament de Universitats, Recerca i Societat de la Informació" de la Generalitat de Catalunya. |
URI: | http://hdl.handle.net/10045/1332 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_35_41.pdf | 185,7 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.