Ayuda
Ir al contenido

Dialnet


Método general de lematización con una gramática mínima y undiccionario óptimo. Aplicación a un corpus dialectal escrito

    1. [1] Universitat de Barcelona

      Universitat de Barcelona

      Barcelona, España

    2. [2] Universidad de Tokio
  • Localización: Language Windowing through Corpora / coord. por Isabel Moskowich, Begoña Crespo, Inés Lareo Martín, Paula Lojo Sandino, Vol. 2, 2010 (Part II, L-Z), ISBN 978-84-9749-401-4, págs. 919-931
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      A falta de lematizadores y etiquetadores para lenguas minoritarias proponemos elaborar nuestro propioprocesador programado por Microsoft Excel VBA. El proceso consiste en asignar provisionalmente lacategoría de partes de oración por un diccionario preparado en procesos anteriores y desambiguar loshomógrafos por una lista de reglas gramaticales, también almacenadas anteriormente, para procederfinalmente a la lematización utilizando el mismo diccionario ahora dotado de información ortográfica ygramatical (categoría).Este método es flexible y aplicable a distintas lenguas europeas y consigue ofrecer un resultado cada vezmejor a medida que en cada operación se nutren tanto el diccionario como la gramática. Nuestra idea escrear un aparato de procesamiento común, que se activa con parámetros léxicos y gramaticalesespecíficos de cada lengua, objeto de investigación

    • English

      Owing to the lack of lemmatizers and taggers for minority languages, we propose to develop our ownprocessor programmed by Microsoft Excel VBA. The process consists in assigning temporarily thecategory of parts of sentences through a dictionary prepared in previous processes and disambiguatinghomographs using a list of grammatical rules, also stored previously, in order to finally lemmatize thetext using the same dictionary now provided with spelling and grammar (category) information.This method is flexible and applicable to different European languages and offers a better result as boththe dictionary and the grammar are fed on each transaction. Our idea is to create a common processingapparatus, which is activated with language specific lexical and grammatical parameters


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno