Santiago de Compostela, España
Las tres grandes diferencias entre la lexicografía del siglo XXI y la tradicional son el paso del enfoque prescriptivo a un planteamiento fundamentalmente descriptivo, el empleo generalizado de recursos computacionales (la lexicografía electrónica) y el uso de grandes corpus textuales como fuentes de datos para la selección del lemario, la detección y organización de acepciones y subacepciones, la extracción de entornos sintácticos y coapariciones, la elección de ejemplos reales para la ilustración de significados, etc. En este capitulo nos proponemos analizar dos aspectos especialmente importantes en el trabajo con corpus y escasamente estudiados en español: la selección del léxico y los problemas asociados a la lematización automática que se practica en los corpus de referencia.
Three important changes have occurred in Spanish lexicography in the twenty-first century: the evolution from a prescriptive approach to a more descriptive one; the generalized use of computational resources (electronic lexicography); and the use of big textual corpora. These corpora provide data from which to select the lemmas, identify and organize word senses and sub-senses, extract syntactic patterns and collocations, and select real instances to illustrate meanings, etc. In this chapter, we will two especially important aspects in the field of corpus studies, which up to now have hardly been investigated in the case of Spanish: lexicon selection and the main problems related to automatic lemmatization as practiced in reference corpora.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados