Detección y clasificación de falacias prototípicas y espontáneas en español
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/137096
Título: | Detección y clasificación de falacias prototípicas y espontáneas en español |
---|---|
Título alternativo: | Detection and classification of prototypical and spontaneous fallacies in Spanish |
Autor/es: | Cruz Mata, Fermín | Troyano Jiménez, José Antonio | Enríquez de Salamanca Ros, Fernando | Ortega Rodríguez, Francisco Javier |
Palabras clave: | Recursos lingüísticos | Clasificación y detección de falacias | Ajuste de modelos de lenguaje | Linguistic resources | Fallacy classification and detection | Language model tuning |
Fecha de publicación: | sep-2023 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | Procesamiento del Lenguaje Natural. 2023, 71: 53-62. https://doi.org/10.26342/2023-71-4 |
Resumen: | El empleo de falacias en el seno de los debates públicos en contextos políticos, sanitarios, económicos y sociales supone un perjuicio en tanto que dificulta el entendimiento entre las partes y facilita la manipulación de la opinión pública y la propagación de desinformación. Recientemente, han aparecido conjuntos de datos que aglutinan falacias de distintos tipos, lo que habilita la experimentación en tareas como la clasificación automática de falacias. En este trabajo, presentamos el primer corpus de falacias en español, con dos secciones diferenciadas: una formada por ejemplos prototípicos extraídos de materiales educativos, y otra por ejemplos espontáneos extraídos de comentarios on-line a noticias. Ambas secciones incluyen ejemplos de textos no falaces, de temática similar. Los resultados preliminares al abordar las tareas de detección y clasificación usando el recurso que hemos creado muestran que se trata de una tarea desafiante (especialmente cuando se centra en falacias espontáneas) que podría ser buena candidata para formar parte de las tareas con las que se evalúan los últimos avances en modelos de lenguaje. | The use of fallacies in public debates in political, health, economic and social contexts is detrimental in that it hinders understanding between the parties and facilitates the manipulation of public opinion and the propagation of misinformation. Recently, datasets containing various types of fallacies have become available, allowing experimentation in tasks such as automatic fallacy classification. In this paper, we present the first corpus of fallacies in Spanish, with two distinct sections: one formed by prototypical examples extracted from educational materials, and the other by spontaneous examples extracted from on-line comments to news items. Both sections include examples of non-fallacious texts of similar subject matter. Preliminary results on the detection and classification tasks using the corpus we have created show that it is a challenging task (especially when focused on spontaneous fallacies) that could be a good candidate to be part of the tasks with which the latest advances in language models are evaluated. |
Patrocinador/es: | Esta publicación es parte del proyecto PID2021-123005 financiado por MCIN/ AEI/10.13039/501100011033/ y por FEDER Una manera de hacer Europa. |
URI: | http://hdl.handle.net/10045/137096 |
ISSN: | 1135-5948 |
DOI: | 10.26342/2023-71-4 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Derechos: | © Sociedad Española para el Procesamiento del Lenguaje Natural. Distribuido bajo Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 |
Revisión científica: | si |
Versión del editor: | https://doi.org/10.26342/2023-71-4 |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 71 (2023) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_71_04.pdf | 1,05 MB | Adobe PDF | Abrir Vista previa | |
Este ítem está licenciado bajo Licencia Creative Commons