Ayuda
Ir al contenido

Dialnet


Resumen de Classifying Spanish se constructions: from bag of words to language models

Nuria Aldama García, Álvaro Barbero Jiménez

  • español

    Las construcciones con se en español son un complejo fenómeno lingüístico que desafía tareas de Procesamiento del Lenguaje Natural (PLN) como el etiquetado automático de categoría gramatical (POS tagging) o de relaciones de dependencias. Se es una forma de alta frecuencia que aparece en nueve tipos de construcciones sintácticas del español, aportando información de diferente naturaleza en función del contexto. Por ello, para tratar el problema de clasificación que plantean las construcciones con se de manera eficiente, este estudio propone un sistema de etiquetado de se aplicado a un corpus de 2.140 oraciones y probado con 9 clasificadores basados en modelos de aprendizaje automático y un parser de dependencias. Los resultados muestran que los modelos pre-entrenados basados en arquitectura de transformers alcanzan los valores más elevados de exactitud (0,83) y de F-score (0,70).

  • English

    Spanish se constructions are a complex linguistic phenomenon that challenges Natural Language Processing (NLP) tasks such as part-of-speech or dependency relation tagging. Se is a high-frequency word that appears in nine different types of syntactic constructions and adds information of diverse nature depending on the context. Thus, to solve the problem Spanish se constructions poses in an efficient way, this study proposes a tagging system for se applied to a corpus composed of 2,140 sentences. This corpus is used in a classification experiment where 9 classifiers based on machine learning models and a dependency parser are tested. Results show that pre-trained language models based on transformers architecture reach the highest accuracy (0.83) and f-score (0.70) values.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus