Morphological segmentation for extracting Spanish-Nahuatl bilingual lexicon

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/96596
Información del item - Informació de l'item - Item information
Título: Morphological segmentation for extracting Spanish-Nahuatl bilingual lexicon
Título alternativo: Segmentación morfológica para extraer un lexicón bilingüe español-náhuatl
Autor/es: Gutierrez-Vasques, Ximena | Medina-Urrea, Alfonso | Sierra Martínez, Gerardo
Palabras clave: Morphology | Bilingual | Translation | Nahuatl | Spanish | Morfología | Bilingüe | Traducción | Español
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2019
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2019, 63: 41-48. doi:10.26342/2019-63-4
Resumen: The aim of this work is to extract word translation pairs from a small parallel corpus and to measure the impact of dealing with morphology for improving this task. We focus on the language pair Spanish-Nahuatl, both languages are morphologically rich and distant from each other. We generate semi-supervised morphological segmentation models and we compare two approaches (estimation, association) for extracting bilingual correspondences. We show that taking into account typological properties of the languages, such as the morphology, helps to counteract the negative effect of working with a low-resource language. | El objetivo de este trabajo es extraer pares de traducción a partir de un corpus paralelo pequeño, así como medir el impacto de lidiar con la morfología para mejorar esta tarea. Nos enfocamos en el par de lenguas español-náhuatl, las dos lenguas son morfológicamente ricas y tipológicamente distantes. Generamos modelos semisupervisados de segmentación morfológica y comparamos dos enfoques (estimativo, asociativo) para extraer pares bilingües de palabras. Mostramos que tomar en cuenta las propiedades tipológicas de la lengua, como la morfología, ayuda a contrarrestar el efecto negativo de trabajar con una lengua de bajos recursos.
Patrocinador/es: This work was supported by the Mexican Council of Science and Technology (CONACYT), fund 2016- 01-2225.
URI: http://hdl.handle.net/10045/96596
ISSN: 1135-5948
DOI: 10.26342/2019-63-4
Idioma: eng
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2019-63-4
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 63 (2019)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_63_04.pdf950,48 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.