Ayuda
Ir al contenido

Dialnet


Resumen de Procesamiento del lenguaje natural y fijacióndel texto: Experiencias en torno a la constituciónde un corpus diacrónico de sonetos

Helena Bermúdez Sabel, Clara Isabel Martínez Cantón, Pablo Ruiz Fabo

  • español

    Esta contribución surge en el contexto de desarrollo del corpus de sonetos DISCO (Diachronic Spanish Sonnet Corpus), un corpus de 4530 sonetos en españolcompuestos entre el siglo xvi y el xx por autores de diversas procedencias (Europa, Latinoamérica y Filipinas). Este recurso contiene las anotaciones de diferentes fenómenos de versificación que han sido obtenidas a partir de técnicas delprocesamiento del lenguaje natural (PLN). En este artículo presentamos cómolos resultados de la anotación automática pueden ser utilizados para detectarproblemas de transmisión textual. Uno de los objetivos de esta contribución esel de proporcionar claves sobre posibles flujos de trabajo que, ayudándose deherramientas de PLN, permitan detectar posibles errores textuales, centrandoasí los esfuerzos de revisión manual en pasajes concretos.

  • English

    We present work carried out within the development of DISCO, the Diachronic Spanish Sonnet Corpus project, which consists of 4,530 sonnets in Spanish from Europe, Latin America and the Philippines, including texts from the15th to the 20th centuries. The resource offers versification annotations obtained automatically through tools based on Natural Language Processing(NLP). In this article, we present how automatic annotation results can be exploited to detect textual transmission errors. Drawing on our experience withDISCO, we present observations towards the creation of workflows assisted byNLP-based tools, which can help detect possible textual errors, thus allowing usto focus on specific passages for our manual correction effort.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus