Ayuda
Ir al contenido

Dialnet


Resumen de UnderRL Tagger: un etiquetador gramatical para lenguas infrasoportadas tecnológicamente y lenguas minoritarias

José Luis Pemberty Tamayo, Jorge Mauricio Molina Mejía, Víctor Julián Vallejo Zapata

  • español

    En este artículo se presenta UnderRL Tagger, un programa informático de acceso libre diseñado para el etiquetado morfosintáctico (POS tagging) en lenguas que no cuentan con etiquetadores automáticos. El programa busca facilitar el trabajo con corpus en estas lenguas infrasoportadas tecnológicamente y en las lenguas minoritarias, aportando así a los procesos de revitalización desde la investigación descriptiva y las herramientas computacionales. UnderRL Tagger permite que el proceso manual de etiquetado se convierta poco a poco en automático gracias a un sistema que permite recordar y reutilizar las etiquetas, manejar grandes cantidades de textos y generar archivos de salida en formato XML con etiquetas basadas en el sistema estandarizado EAGLES. Este artículo muestra el proceso de modelado y elaboración del sistema, sus diferentes funcionalidades y las perspectivas de trabajos posteriores.

  • English

    This article presents UnderRL Tagger, a free software designed for POS tagging in languages that do not have automatic taggers. The program attempts to facilitate work with corpus in these under-resourced languages and in minority languages, thus contributing to revitalization processes from descriptive research and computational tools. UnderRL Tagger allows the manual tagging process to gradually become automatic thanks to a system that allows the user to remember and reuse tags, manage large amounts of text and generate output files in XML format with tags based on the standardized EAGLES system. This article shows the process of modeling and elaboration of the system, its different functionalities and the perspectives of later works.

  • português

    Este artigo apresenta o UnderRL Tagger, um software disponível gratuitamente desenvolvido para marcação gramatical (POS tagging) em idiomas que não possuem anotadores automáticos. O programa busca facilitar o trabalho com corpus nessas línguas tecnologicamente pouco suportadas e em línguas minoritárias, contribuindo assim para processos de revitalização a partir de pesquisas descritivas e ferramentas computacionais. O UnderRL Tagger permite que o processo de marcação manual se torne gradualmente automático graças a um sistema que permite lembrar e reutilizar tags, gerenciar grandes quantidades de texto e gerar arquivos de saída em formato XML com tags baseadas no sistema EAGLES padronizado. Este artigo mostra o processo de modelagem e elaboração do sistema, suas diferentes funcionalidades e as perspectivas de trabalhos posteriores.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus