Violencia Identificada en el Lenguaje (VIL). Creación de recurso para mensajes violentos

Botella, Beatriz; Sepúlveda-Torres, Robiert; Martínez-Barco, Patricio; Saquete Boró, Estela

Violencia Identificada en el Lenguaje (VIL). Creación de recurso para mensajes violentos

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/133265

Información del item - Informació de l'item - Item information
Título:	Violencia Identificada en el Lenguaje (VIL). Creación de recurso para mensajes violentos
Título alternativo:	Violence Identified in Language (VIL). Creation of a resource for the detection of violent messages
Autor/es:	Botella, Beatriz \| Sepúlveda-Torres, Robiert \| Martínez-Barco, Patricio \| Saquete Boró, Estela
Grupo/s de investigación o GITE:	Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
Centro, Departamento o Servicio:	Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Palabras clave:	Procesamiento Lenguaje Natural \| Guía Anotación \| Anotación Corpus \| Detección Mensajes Violentos \| Natural Language Processing \| Annotation Guideline \| Dataset Annotation \| Detection of Violent Messages
Fecha de publicación:	mar-2023
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	Procesamiento del Lenguaje Natural. 2023, 70: 187-198. https://doi.org/10.26342/2023-70-15
Resumen:	La sociedad avanza cargada de conocimientos nuevos y muy accesibles, que se publican en el mundo virtual. Es una realidad que las Tecnologías de la Información y la Comunicación (TIC) han traído muchos beneficios a nuestras vidas pero también vemos como año tras año aumenta el uso de violencia en plataformas digitales. Nuestro trabajo se enfoca en la creación de recursos que permitan la detección de mensajes violentos en la red social Twitter. Se parte de la creación de una guía de anotación de grano fino para anotar un corpus de mensajes violentos (VIL) con el fin de utilizar herramientas de aprendizaje automático que nos ayuden a detectar automáticamente el problema. Con este corpus se entrenan dos modelos de lenguaje (BETO y RoBERTa base) con los que se alcanza un valor en la métrica F1m de 97.03% y 96.51% clasificando si un tuit es o no violento. \| Society is moving forward full of new and very accessible knowledge, which is published in the virtual world. It is a reality that ICTs have brought many benefits to our lives but we also see how year after year the use of violence on digital platforms increases. Our work focuses on the detection of violent messages in the social network Twitter. Starting from the creation of a fine-grained annotation guide to obtain a corpus of violent messages (VIL) in order to use Machine Learning tools that help us to automatically detect the problem Two language models are trained with this corpus (BETO and RoBERTa base) with which a value of 97.03% and 96.51% is reached in the F1m metric, classifying whether or not a tweet is violent.
Patrocinador/es:	Esta investigación ha sido financiada por MCIN/AEI/ 10.13039/501100011033 y la Unión Europea NextGenerationEU/PRTR a través de los proyectos “TRIVIAL” (PID2021-122263OB-C22) and “SocialTrust” (PDC2022-133146-C22). También cuenta con el apoyo de la Generalitat Valenciana a través del proyecto “NL4DISMIS” (CIPROM/2021/21).
URI:	http://hdl.handle.net/10045/133265
ISSN:	1135-5948
DOI:	10.26342/2023-70-15
Idioma:	spa
Tipo:	info:eu-repo/semantics/article
Derechos:	© Sociedad Española para el Procesamiento del Lenguaje Natural. Distribuido bajo Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0
Revisión científica:	si
Versión del editor:	https://doi.org/10.26342/2023-70-15
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 70 (2023) INV - GPLSI - Artículos de Revistas

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_70_15.pdf		1,04 MB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo

Este ítem está licenciado bajo Licencia Creative Commons