Barcelona, España
A falta de lematizadores y etiquetadores para lenguas minoritarias proponemos elaborar nuestro propioprocesador programado por Microsoft Excel VBA. El proceso consiste en asignar provisionalmente lacategoría de partes de oración por un diccionario preparado en procesos anteriores y desambiguar loshomógrafos por una lista de reglas gramaticales, también almacenadas anteriormente, para procederfinalmente a la lematización utilizando el mismo diccionario ahora dotado de información ortográfica ygramatical (categoría).Este método es flexible y aplicable a distintas lenguas europeas y consigue ofrecer un resultado cada vezmejor a medida que en cada operación se nutren tanto el diccionario como la gramática. Nuestra idea escrear un aparato de procesamiento común, que se activa con parámetros léxicos y gramaticalesespecíficos de cada lengua, objeto de investigación
Owing to the lack of lemmatizers and taggers for minority languages, we propose to develop our ownprocessor programmed by Microsoft Excel VBA. The process consists in assigning temporarily thecategory of parts of sentences through a dictionary prepared in previous processes and disambiguatinghomographs using a list of grammatical rules, also stored previously, in order to finally lemmatize thetext using the same dictionary now provided with spelling and grammar (category) information.This method is flexible and applicable to different European languages and offers a better result as boththe dictionary and the grammar are fed on each transaction. Our idea is to create a common processingapparatus, which is activated with language specific lexical and grammatical parameters
© 2001-2024 Fundación Dialnet · Todos los derechos reservados