Clasificación y generalización de formas verbales en sistemas de traducción estocástica

Gispert Ramis, Adrià de; Mariño Acebal, José Bernardo; Crego Clemente, Josep María

Clasificación y generalización de formas verbales en sistemas de traducción estocástica

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1332

Información del item - Informació de l'item - Item information
Título:	Clasificación y generalización de formas verbales en sistemas de traducción estocástica
Autor/es:	Gispert Ramis, Adrià de \| Mariño Acebal, José Bernardo \| Crego Clemente, Josep María
Palabras clave:	Traducción estocástica \| Conocimiento lingüístico \| Formas verbales \| Morfología \| Stochastic machine translation \| Linguistic knowledge \| Verb forms \| Morphology
Fecha de publicación:	sep-2005
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	GISPERT RAMIS, Adrià de; MARIÑO ACEBAL, José Bernardo; CREGO CLEMENTE, Josep María. “Clasificación y generalización de formas verbales en sistemas de traducción estocástica”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 335-342
Resumen:	En esta comunicación se propone un método para incorporar conocimiento lingüístico relativo a las formas verbales en sistemas estocásticos de traducción. Por medio de una clasificación basada en conocimiento de dichas formas, y de su sustitución por el lema del verbo principal durante la fase de entrenamiento, se consigue un mejor alineado en palabras, cuya consecuencia es una mejor estimación del modelo de traducción. Además, a partir de las formas verbales observadas en el entrenamiento es posible generalizar con éxito y proporcionar traducciones a nuevas formas no vistas anteriormente. El método propuesto es evaluado en una tarea de traducción del inglés al español de dominio restringido, donde se alcanza una mejora significativa. \| This paper introduces a method to incorporate linguistic knowledge regarding verb forms into an stochastic machine translation model. By means of a rule-based classification of these forms, and by substituting them by the base form of the head verb during the training stage, we achieve a better statistical word alignment, which leads to a better estimate of the translation model. Furthermore, a successful generalization strategy can be devised to produce a new translation for unseen verb forms from the translations of seen verb forms. An evaluation of this method in an English to Spanish limited-domain translation task is presented, producing a significant performance improvement.
Patrocinador/es:	Este trabajo ha sido financiado parcialmente por la CICYT a través del proyecto TIC2002-04447-C02 (ALIADO), la Unión Europea mediante el proyecto FP6-506738 (TC-STAR), y el "Departament de Universitats, Recerca i Societat de la Informació" de la Generalitat de Catalunya.
URI:	http://hdl.handle.net/10045/1332
ISSN:	1135-5948
Idioma:	spa
Tipo:	info:eu-repo/semantics/article
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_35_41.pdf		185,7 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo