Ayuda
Ir al contenido

Dialnet


Resumen de Discourse marker characterisation via clustering: extrapolation from supervised to unsupervised corpora

Karina Gibert Oliveras, Lluís Padró Cirera, Irene Castellón Masalles, Laura Alonso Alemany

  • español

    En este artículo mostraremos cómo las técnicas de clustering pueden aportar evidencia empírica para una caracterización de los Marcadores del Discurso (DMs) que contribuya a superar la falta de consenso y reduzca el coste de construcción de los recursos de PLN basados en DMs. Hemos establecido una noción de prototipicalidad de DMs comparando las clasificaciones de corpus anotado manualmente y automáticamente, a partir de la cual podemos obtener clasificaciones fiables a partir de corpus anotado automáticamente.

  • English

    In this paper we will show how clustering techniques provide empirical evidence for a characterisation of Discourse Markers (DMs) that helps in overcoming the lack of consensus and reduces the cost of building NLP resources based on DMs. By comparison of classifications from hand-tagged and unsupervised corpora we are capable of grounding a notion of DM prototypicality, from which reliable classifications can be obtained from fully unsupervised corpora.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus