Clasificación y generalización de formas verbales en sistemas de traducción estocástica

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1332
Información del item - Informació de l'item - Item information
Título: Clasificación y generalización de formas verbales en sistemas de traducción estocástica
Autor/es: Gispert Ramis, Adrià de | Mariño Acebal, José Bernardo | Crego Clemente, Josep María
Palabras clave: Traducción estocástica | Conocimiento lingüístico | Formas verbales | Morfología | Stochastic machine translation | Linguistic knowledge | Verb forms | Morphology
Fecha de publicación: sep-2005
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: GISPERT RAMIS, Adrià de; MARIÑO ACEBAL, José Bernardo; CREGO CLEMENTE, Josep María. “Clasificación y generalización de formas verbales en sistemas de traducción estocástica”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 335-342
Resumen: En esta comunicación se propone un método para incorporar conocimiento lingüístico relativo a las formas verbales en sistemas estocásticos de traducción. Por medio de una clasificación basada en conocimiento de dichas formas, y de su sustitución por el lema del verbo principal durante la fase de entrenamiento, se consigue un mejor alineado en palabras, cuya consecuencia es una mejor estimación del modelo de traducción. Además, a partir de las formas verbales observadas en el entrenamiento es posible generalizar con éxito y proporcionar traducciones a nuevas formas no vistas anteriormente. El método propuesto es evaluado en una tarea de traducción del inglés al español de dominio restringido, donde se alcanza una mejora significativa. | This paper introduces a method to incorporate linguistic knowledge regarding verb forms into an stochastic machine translation model. By means of a rule-based classification of these forms, and by substituting them by the base form of the head verb during the training stage, we achieve a better statistical word alignment, which leads to a better estimate of the translation model. Furthermore, a successful generalization strategy can be devised to produce a new translation for unseen verb forms from the translations of seen verb forms. An evaluation of this method in an English to Spanish limited-domain translation task is presented, producing a significant performance improvement.
Patrocinador/es: Este trabajo ha sido financiado parcialmente por la CICYT a través del proyecto TIC2002-04447-C02 (ALIADO), la Unión Europea mediante el proyecto FP6-506738 (TC-STAR), y el "Departament de Universitats, Recerca i Societat de la Informació" de la Generalitat de Catalunya.
URI: http://hdl.handle.net/10045/1332
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_35_41.pdf185,7 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.