NoNiRes: Corpus del catalán anotado con negación

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/137095
Información del item - Informació de l'item - Item information
Título: NoNiRes: Corpus del catalán anotado con negación
Título alternativo: NoNiRes: A Catalan corpus annotated with negation
Autor/es: Tañá Velasco, Laura | Nofre, Montserrat | Calvo Figueras, Blanca | Armentano Oller, Carme
Palabras clave: Negación | Foco de la negación | Anotación de corpus | Recursos de tecnología lingüística del catalán | Negation | Focus of negation | Corpus annotation | Catalan linguistic resources
Fecha de publicación: sep-2023
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2023, 71: 39-51. https://doi.org/10.26342/2023-71-3
Resumen: En este artículo se presentan los criterios aplicados para la anotación de la negación y del foco de la negación del corpus NoNiRes del catalán. El corpus está constituido por 20.600 oraciones procedentes de datasets ya existentes (5.000 oraciones), un foro de Internet (10.000 oraciones) y un periódico digital (5.600 oraciones). Se han tratado aspectos complejos como son el foco y la gradación de la negación. Se ofrecen datos estadísticos exhaustivos sobre las estructuras anotadas. | In this article we present the criteria applied for the annotation of negation and focus of negation of the corpus NoNiRes of Catalan. The corpus is composed of 20.600 sentences from existing datasets (5.000 sentences), an Internet forum (10.000 sentences), and a digital newspaper (5.600 sentences). Complex aspects such as the focus and the gradation of negation have been dealt with. Comprehensive statistical data on the annotated structures are provided.
Patrocinador/es: Este trabajo ha sido financiado por CLiC, Centre de Llenguatge i Computació, grupo de investigación consolidado por la Generalitat de Catalunya (2021 SGR 00313), y por el Departament de la Vicepresidència i de Polítiques Digitals i Territori de la Generalitat de Catalunya, dentro del marco del Projecte AINA.
URI: http://hdl.handle.net/10045/137095
ISSN: 1135-5948
DOI: 10.26342/2023-71-3
Idioma: spa
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural. Distribuido bajo Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2023-71-3
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 71 (2023)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_71_03.pdf1,02 MBAdobe PDFAbrir Vista previa


Este ítem está licenciado bajo Licencia Creative Commons Creative Commons