La perplejidad como herramienta para estimar la asignación de nivel de competencia en escritos de una lengua extranjera

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/137143
Información del item - Informació de l'item - Item information
Título: La perplejidad como herramienta para estimar la asignación de nivel de competencia en escritos de una lengua extranjera
Título alternativo: Perplexity as a tool for the allocation of proficiency levels to utterances written by foreign language learners
Autor/es: Agustín Llach, María del Pilar | Heras, Jonathan | Mata, Gadea | Rubio, Julio
Palabras clave: Perplejidad | Deep Learning | ELE | Perplexity | Spanish as a Foreign Language
Fecha de publicación: sep-2023
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2023, 71: 29-38. https://doi.org/10.26342/2023-71-2
Resumen: La asignación de niveles de competencia a escritos producidos por aprendices de una lengua es una tarea altamente subjetiva. Es por esto que el desarrollo de métodos que evalúen escritos de manera automática puede ayudar tanto al profesorado como al alumnado. En este trabajo, hemos explorado dos vías mediante el uso del corpus CAES. Dicho corpus está formado por escritos de aprendices de español y etiquetado con niveles CEFR (hasta el C1). La primera aproximación es un modelo de aprendizaje profundo llamado Deep-ELE que asigna niveles de competencia a las frases. La segunda aproximación llevada a cabo ha consistido en estudiar la perplejidad de las frases de los estudiantes de distintos niveles, para luego clasificarlos en niveles. Ambas aproximaciones han sido evaluadas, y se ha comprobado que pueden usarse de manera exitosa para clasificar frases por niveles. En concreto, el modelo Deep-ELE obtiene una accuracy de 81,3% y un QWK de 0,83. Como conclusión, este trabajo es un paso para entender cómo las herramientas del procesado de lenguaje natural pueden ayudar a las personas que aprenden un segundo idioma. | The allocation of proficiency levels to utterances written by foreign language learners is a subjective task. Therefore, the development of methods to automatically evaluate written sentences can help both students and teachers. In this work, we have explored two different approaches to tackle this task by using the corpus CAES, which contains written utterances of learners of Spanish labelled with CEFR levels (up to C1). The first approach is a deep learning model called Deep-ELE which assigns proficiency levels to sentences. The second approach consists in studying the perplexity of sentences written by students of different levels, to later allocate levels to those sentences based on such an analysis. Both approaches have been evaluated, and results confirm that they can be used to successfully classify written sentences into proficiency levels. In particular, the Deep-ELE model reaches an accuracy of 81.3% and a weighted Cohen Kappa of 0.83. As a conclusion, this work is a step towards better understanding how natural language processing methods can help learners of a second language.
Patrocinador/es: Esta investigación ha sido parcialmente financiada por los proyectos AFIANZA 2022/02, PID2020-115225RB-I00 de MCIN/AEI/ 10.13039/501100011033 y PID2020-116641GB-I00 de MCIN/AEI/10.13039/501100011033.
URI: http://hdl.handle.net/10045/137143
ISSN: 1135-5948
DOI: 10.26342/2023-71-2
Idioma: spa
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural. Distribuido bajo Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2023-71-2
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 71 (2023)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_71_02.pdf1,81 MBAdobe PDFAbrir Vista previa


Este ítem está licenciado bajo Licencia Creative Commons Creative Commons