Katrin Herget, Jean Ezra Yeung, Michelle Rufrano, Teresa Alegre
La recopilación y el análisis de corpus multilingües desempeñan un papel fundamental en un mundo cada vez más digital. El acceso a corpus de gran volumen permite estudiar y describir una gran variedad de elementos y patrones lingüísticos. Recientemente, se ha llevado a cabo una amplia investigación sobre el uso del topic modeling para el análisis de debates políticos (Guldi 2019; Ristilä yElo 2023). Nuestro estudio se basa en la exploración de corpus comparables de debates parlamentarios (Erjavec et al. 2023) en tres idiomas. Los corpus austriaco, británico y portugués analizados se recopilaron del repositorio de recursos lingüísticos CLARIN ERIC. En nuestro estudio, empleamos un enfoque basado en topic modeling para investigar los campos semántico-temáticos en los discursos políticos. Los datos extraídos de los tres países se compararán para alcanzar conclusiones relativas al análisis de posibles convergencias o divergencias temáticas.
The collection and analysis of multilingual text corpora assumes a fundamental role in an ever-digitizing world.The access to large-volumecorpora allows the study and description of variouslinguistic items and patterns. Recently, extensive research has been conducted on topic modeling for analysingpolitical debates (Guldi 2019; Ristilä andElo 2023). Ourstudy is based on the exploration of comparable corpora of parliamentary debates (Erjavec et al. 2023) in three languages. The analysed corpora were collected from the language resource repository CLARIN ERIC for the Austrian, British,and Portuguese datasets. Ourstudyemploysa topic modeling approach to investigate semantic-thematic fields in political speeches. The extracted data from the three countries will be compared to draw conclusions regarding the analysis of potential thematic convergences or divergences.
© 2001-2025 Fundación Dialnet · Todos los derechos reservados