Barcelona, España
En este artículo se quiere mostrar cómo se realiza el análisis de unidades léxicas compuestas como las locuciones, los tiempos verbales compuestos y las locuciones verbales en español, en el marco del sistema de análisis léxico del proyecto FrameNet Español161 basado en un diccionario electrónico formado por 634.500 formas, simples y compuestas, y un conjunto de gramáticas y herramientas construidas tomando las máquinas de estado finito como modelo matemático. El análisis de estos elementos se realiza sobre un corpus de oraciones anotadas léxicamente, de modo que cada unidad léxica (palabra) se anota con su correspondiente categoría léxica y sus características morfológicas, como en el caso de los verbos, nombres y adjetivos.
This article aims to show how to perform lexical analysis of multiword lexical units like compound tenses and verbal phrases in Spanish, in the context of the lexical analysis system developed in the Spanish FrameNet project, based on an electronic dictionary consisting of 634,500 forms, simple and compound, and a set of grammars and tools built to take the finite state machine as mathematical model. The analysis of these elements is performed on a corpus of lexically annotated sentences, so that each lexical unit (word) is annotated with its corresponding lexical category and morphological characteristics, as in the case of verbs, nouns and adjectives.
© 2001-2025 Fundación Dialnet · Todos los derechos reservados