Ayuda
Ir al contenido

Dialnet


Resumen de Una herramienta para la manipulación de corpora bilingüe usando distancia léxica

Rafael Borrego Ropero, Víctor Díaz

  • español

    En este artículo se presenta una herramienta que permite anotar corpora bilingüe y realizar alineamiento entre textos usando heurísticas basadas en frecuencia, posición y cercanía léxica (con Edit Distance). La anotación de corpora bilingue es una tarea muy laboriosa pero esencial a la hora de desarrollar bases de conocimiento para la realización de traducciones automáticas entre distintos idiomas. Esta herramienta ayuda esta tarea, permitiendo anotar de forma rápida y sencilla. Incluye características que facilitan la edición de textos planos y de textos anotados.

  • English

    In this article is presented a tool for labeling bilingual parallel corpora and aligning texts using heuristics based on word frequency, position and lexicographical similarity (using Edit Distance). Bilingual corpora annotation is a very laborious task but essential at the time of developing knowledge bases for the accomplishment of automatic translations between different languages. This tool helps to this task, allowing to annotate texts in a fast and simple way. It includes characteristics that help editing plain and annotated texts.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus