A Discourse Marker Tagger for Spanish using Transformers
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/122849
Título: | A Discourse Marker Tagger for Spanish using Transformers |
---|---|
Título alternativo: | Etiquetador automático de Marcadores Discursivos mediante Transformers |
Autor/es: | García Toro, Ana | Porta Zamorano, Jordi | Moreno Sandoval, Antonio |
Palabras clave: | Discourse Markers | Spanish | Fine-tuning Transformers |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | mar-2022 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | Procesamiento del Lenguaje Natural. 2022, 68: 123-132. https://doi.org/10.26342/2022-68-9 |
Resumen: | We present an automatic discourse particle (DM) tagger developed using manual annotation and machine learning. The tagger has been developed on a dataset of financial letters, where human annotators have reached an 0.897 agreement rate (IAA) on the indications of a specific annotation guide. With the annotated dataset, a prototype has been developed using the pre-trained Transformers, adapting it to the task (fine-tunning), reaching an F1-score of 0.933. An evaluation of the results obtained by the tagger is included. | Presentamos un etiquetador automático de partículas discursivas (DM) desarrollado mediante etiquetado manual y aprendizaje automático. El etiquetador se ha desarrollado en un dataset de cartas financieras. Las anotadoras humanas han alcanzado un 0,897 de tasa de acuerdo (IAA) sobre las indicaciones de una guía de anotación específica. Con el dataset anotado se ha desarrollado un prototipo usando modelos de Transformers pre-entrenados adaptándolos a la tarea (fine-tuning) con un F1 de 0,933. Al final se da una evaluación de los resultados obtenidos por el tagger. |
Patrocinador/es: | The research has been carried out within the CLARA-FINT project (PID2020-116001RB-C31), funded by the Spanish Ministry of Science and Innovation. |
URI: | http://hdl.handle.net/10045/122849 |
ISSN: | 1135-5948 |
DOI: | 10.26342/2022-68-9 |
Idioma: | eng |
Tipo: | info:eu-repo/semantics/article |
Derechos: | © Sociedad Española para el Procesamiento del Lenguaje Natural |
Revisión científica: | si |
Versión del editor: | https://doi.org/10.26342/2022-68-9 |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 68 (2022) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_68_09.pdf | 1,04 MB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.