Métodos de lexicometría sociolingüística: análisis del corpus oral contemporáneo PRESEEA-Santander

Inmaculada Martínez Martínez; Hiroto Ueda

Ayuda

Métodos de lexicometría sociolingüística: análisis del corpus oral contemporáneo PRESEEA-Santander

Martínez Martínez, Inmaculada ; Ueda, Hiroto ^[1]
1. [1] Universidad de Tokio (Japón)
Localización: Círculo de lingüística aplicada a la comunicación, ISSN-e 1576-4737, Nº. 94, 2023 (Ejemplar dedicado a: Monográfico: Patrones sociolingüísticos y geolectales del español. Estudios sobre el corpus PRESEEA), págs. 227-245
Idioma: español
Títulos paralelos:
- Methods of sociolinguistic lexicometry: analysis of the contemporary oral corpus PRESEEA-Santander
Enlaces
- Texto completo
Resumen
- español
  La lexicometría es un método que nos permite identificar unidades temáticas derivadas de la extracción automática de patrones de conocimiento en datos de naturaleza textual (Romero, Alarcón y García, 2018). De su aplicación emergen las tendencias léxicas de un corpus a través de la cuantificación de la ocurrencia de las palabras. Los distintos estilos léxicos sociolingüísticos se han estudiado en amplias variedades de las lenguas del mundo, incluida la lengua española. Sin embargo, no existen, en los estudios llegados a nuestro alcance hasta el momento, suficientes análisis cuantitativos del léxico de un corpus sociolingüístico oral contemporáneo.
  
  El objetivo general de este artículo es detectar las preferencias de uso del vocabulario de la lengua española hablada en el marco de la lexicometría sociolingüística. Para ello, se analizó una muestra representativa de un corpus estratificado en torno a tres variables (sexo, edad, nivel educativo). Dicha muestra pertenece al corpus PRESEEA-Santander, enmarcado en el Proyecto para el Estudio Sociolingüístico del Español de España y América (Moreno Fernández, 2021). En el análisis se empleó el sistema LYNEAL (Letras y Números en Análisis Lingüístico) (Autor, 2021), así como el software estadístico en código abierto R.
  
  La lexicometría es un método que nos permite identificar unidades temáticas derivadas de la extracción automática de patrones de conocimiento en datos de naturaleza textual (Romero, Alarcón y García, 2018). De su aplicación emergen las tendencias léxicas de un corpus a través de la cuantificación de la ocurrencia de las palabras. Los distintos estilos léxicos sociolingüísticos se han estudiado en amplias variedades de las lenguas del mundo, incluida la lengua española. Sin embargo, no existen, en los estudios llegados a nuestro alcance hasta el momento, suficientes análisis cuantitativos del léxico de un corpus sociolingüístico oral contemporáneo.El objetivo general de este artículo es detectar las preferencias de uso del vocabulario de la lengua española hablada en el marco de la lexicometría sociolingüística. Para ello, se analizó una muestra representativa de un corpus estratificado en torno a tres variables (sexo, edad, nivel educativo). Dicha muestra pertenece al corpus PRESEEA-Santander, enmarcado en el Proyecto para el Estudio Sociolingüístico del Español de España y América (Moreno Fernández, 2021). En el análisis se empleó el sistema LYNEAL (Letras y Números en Análisis Lingüístico) (Ueda, 2021), así como el software estadístico en código abierto R. Los resultados apuntan a que el sexo se revela como una variable importante en el proceso de variación léxica al detectarse, entre otros hallazgos, el uso del estilo nominal sobre el verbal y el empleo preferente de adverbios en -mente por parte del hombre; con respecto a la edad, se advierte la tendencia al empleo del truncamiento léxico en la generación de jóvenes y en el género mujer; por último, se aprecia la concentración de uso de muchísimo en mujer, joven, de nivel primario de instrucción.
- English
  Lexicometry is a method that allows us to identify thematic units derived from the automatic extraction of knowledge patterns in data of a textual nature (Romero, Alarcón and García, 2018). From its application, the lexical tendencies of a corpus emerge through the quantification of the occurrence of words. The different sociolinguistic lexical styles have been studied in wide varieties of the world's languages, including the Spanish language. However, in the studies available to us to date, there are not enough quantitative analyzes of the lexicon of a contemporary oral sociolinguistic corpus. The general objective of this article is to detect the preferences for the use of the vocabulary of the spoken Spanish language within the framework of sociolinguistic lexicometry. To do this, a representative sample of a corpus with stratification in three variables (sex, age, educational level) was analyzed. This sample belongs to the PRESEEA-Santander corpus, framed in the Project for the Sociolinguistic Study of Spanish in Spain and America (Moreno Fernández, 2021). The LYNEAL system (Letters and Numbers in Linguistic Analysis) (Ueda, 2021) was used in the analysis, as well as the open-source statistical software R. The results indicate that gender is revealed as an important variable in the process of lexical variation, detecting, among other findings, the use of nominal over verbal style and the preferential use of adverbs in -mente by men; with respect to age, the tendency to use lexical truncation in the younger generation and in the female gender is noted; finally, the concentration of use of muchísimo in women, young people, with a primary education level, is appreciated.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: