Por favor, use este identificador para citas ou ligazóns a este ítem:
http://hdl.handle.net/10347/9587
Título: | Etiquetaxe e desambiguación automáticas en galego: o sistema XIADA
|
Autor/a: | Domínguez Noya, Eva María
|
Dirección/Titoría: | Rojo Sánchez, Guillermo
López Martínez, María Sol
|
Outro/a autor/a: | Facultade de Filoloxía. Departamento de Lingua Española
|
Palabras chave: | XIADA | Corpus de Referencia do Galego Actual etiquetado | bases de datos textuais | |
Data: | 2013-12-27
|
Resumo: | A construción de recursos lingüísticos, entre os que se encontran os corpus ou
bases de datos textuais, é necesaria en toda lingua para continuar profundando no seu
coñecemento, mais tamén é fundamental para o procesamento da linguaxe natural. Nos
últimos anos, ademais, as novas tecnoloxías xorden como un parámetro máis de
clasificación das linguas en función da súa presenza ou ausencia nelas. Neste marco
sitúase o presente traballo, onde se recollen e describen polo miúdo os diferentes
recursos lingüísticos elaborados –etiquetario, lexicón e corpus de adestramento,
basicamente– para que poida executarse con garantías dunha alta taxa de acerto un
etiquetador de tipo estatístico-probabilístico como é o Etiquetador/Lematizador do
galego actual (XIADA), aplicado aos documentos que conforman o Corpus de
Referencia do Galego Actual (CORGA) –corpus considerado representativo da lingua
galega actual, cuxas características lingüísticas constatan as dificultades de traballar con
lingua real–. Coa etiquetaxe permítese dar un salto cualitativo no sistema de consultas,
de xeito que se facilita a recuperación de información a través dunha aplicación web
mediante a consulta por forma, lema, etiqueta morfosintáctica ou calquera combinación
destas; co engadido, naturalmente, das prestacións do CORGA. O resultado palpable da
aplicación do sistema XIADA á análise de corpus en galego pode consultarse en liña
accedendo ao Corpus de Referencia do Galego Actual etiquetado (CORGAetq). |
URI: | http://hdl.handle.net/10347/9587
|
Dereitos: | Esta obra atópase baixo unha licenza internacional Creative Commons BY-NC-ND 4.0. Calquera forma de reprodución, distribución, comunicación pública ou transformación desta obra non incluída na licenza Creative Commons BY-NC-ND 4.0 só pode ser realizada coa autorización expresa dos titulares, salvo excepción prevista pola lei. Pode acceder Vde. ao texto completo da licenza nesta ligazón: https://creativecommons.org/licenses/by-nc-nd/4.0/deed.gl
|