La macroestructura del diccionario (Selección del léxico y lematización)

Guillermo Rojo Sánchez

Ayuda

La macroestructura del diccionario (Selección del léxico y lematización)

Rojo, Guillermo ^[1]
1. [1] Universidade de Santiago de Compostela
  
  Universidade de Santiago de Compostela
  
  Santiago de Compostela, España
Localización: Lexicografía hispánica / coord. por Sergi Torner Castells, María Paz Battaner Arias, Irene Renau, 2024, ISBN 978-1-032-30937-8, págs. 219-232
Idioma: español
Títulos paralelos:
- The macrostructure of the dictionary: Lexicon selection and lemmatization
Texto completo no disponible (Saber más ...)
Resumen
- español
  Las tres grandes diferencias entre la lexicografía del siglo XXI y la tradicional son el paso del enfoque prescriptivo a un planteamiento fundamentalmente descriptivo, el empleo generalizado de recursos computacionales (la lexicografía electrónica) y el uso de grandes corpus textuales como fuentes de datos para la selección del lemario, la detección y organización de acepciones y subacepciones, la extracción de entornos sintácticos y coapariciones, la elección de ejemplos reales para la ilustración de significados, etc. En este capitulo nos proponemos analizar dos aspectos especialmente importantes en el trabajo con corpus y escasamente estudiados en español: la selección del léxico y los problemas asociados a la lematización automática que se practica en los corpus de referencia.
- English
  Three important changes have occurred in Spanish lexicography in the twenty-first century: the evolution from a prescriptive approach to a more descriptive one; the generalized use of computational resources (electronic lexicography); and the use of big textual corpora. These corpora provide data from which to select the lemmas, identify and organize word senses and sub-senses, extract syntactic patterns and collocations, and select real instances to illustrate meanings, etc. In this chapter, we will two especially important aspects in the field of corpus studies, which up to now have hardly been investigated in the case of Spanish: lexicon selection and the main problems related to automatic lemmatization as practiced in reference corpora.