Ayuda
Ir al contenido

Dialnet


Resumen de Radicalizador do português brasileiro baseado na Morfologia Distribuída

Gustavo L. Estivalet, Karla Araújo Pinheiro, José Ferrari Neto

  • português

    A discussão teórica e empírica acerca do processamento morfológico tem sido relacionada às suas diferentes arquiteturas, enquanto os modelos de Full Entry propõem o acesso lexical por meio da representação da palavra inteira, os modelos de Full Parsing propõem o acesso lexical por meio da decomposição morfológica. Nesse sentido, radicalizadores (stemmers) são mecanismos úteis para a análise morfológica porque permitem a conflação de palavras e a modelagem computacional do processamento morfológico, assim como das interfaces morfofonológica e morfossintática. Contudo, os radicalizadores atuais de Processamento de Linguagem Natural foram desenvolvidos desconsiderando os modelos teóricos de Morfologia ou da Linguística. Sendo assim, o objetivo do presente trabalho foi desenvolver um radicalizador do português brasileiro baseado na teoria linguística da Morfologia Distribuída. Os objetivos específicos foram i) apresentar o repertório de morfemas flexionais e derivacionais, ii) analisar os morfemas em termos de traços morfossintáticos e classes gramaticais, e iii) modelar a decomposição de palavras polimorfêmicas. Nossos resultados apontam que um modelo decomposicional é capaz de processar as estruturas morfológicas do português brasileiro. Ainda, um modelo flexível com diferentes subestruturas para os casos de alomorfia poderia apresentar resultados mais eficazes para a derivação e a flexão irregular. Além da radicalização, nosso algoritmo apresenta algumas características específicas, tais como i) a representação dos traços morfossintáticos, ii) a definição da classe gramatical derivacional e iii) especificação teórica baseado na teoria. Enfim, o algoritmo possui código aberto e acesso livre para utilização em diversas aplicações, estando disponível em https://lexicodoportugues.shinyapps.io/Stemmer/.

  • English

    The theoretical and empirical discussion about morphological processing has been related to its different architectures, while the Full Entry models propose lexical access through whole-word representation, the Full Parsing models propose lexical access through morphological decomposition. In this sense, stemmers are useful mechanisms for morphological analysis because they allow the confluence of words and the computational modeling of the morphological processing, as well as the morphophonological and morphosyntactic interfaces. However, the current stemmers from Natural Language Processing have been developed disregarding the theoretical models of Morphology or Linguistics. Therefore, the objective of the present work was to develop a Brazilian Portuguese stemmer based on the linguistic theory of Distributed Morphology. The specific objectives were i) present the repertoire of inflectional and derivational morphemes, ii) analyze the morphemes in terms of morphosyntactic features and grammatical classes, and iii) modeling the decomposition of polymorphemic words. Our results indicate that a decompositional model is capable of processing the morphological structures of Brazilian Portuguese. Still, a flexible model with different substructures for allomorphy cases could present more effective results for irregular derivation and inflection. In addition to stemming, our algorithm presents some specific characteristics, such as i) the representation of the morphosyntactic features, ii) the definition of the derivational grammatical class, and iii) a theoretical specification. The algorithm has open source and free access for use in several applications, being available at https://lexicodoportugues.shinyapps.io/Stemmer/.Keywords:Stemmer


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus