Ayuda
Ir al contenido

Dialnet


Discourse marker characterisation via clustering: extrapolation from supervised to unsupervised corpora

  • Autores: Karina Gibert Oliveras, Lluís Padró Cirera, Irene Castellón Masalles, Laura Alonso Alemany
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 29, 2002 (Ejemplar dedicado a: XVII Congreso de la SEPLN. Universidad de Valladolid, 11-13 septiembre 2002), págs. 223-230
  • Idioma: inglés
  • Enlaces
  • Resumen
    • español

      En este artículo mostraremos cómo las técnicas de clustering pueden aportar evidencia empírica para una caracterización de los Marcadores del Discurso (DMs) que contribuya a superar la falta de consenso y reduzca el coste de construcción de los recursos de PLN basados en DMs. Hemos establecido una noción de prototipicalidad de DMs comparando las clasificaciones de corpus anotado manualmente y automáticamente, a partir de la cual podemos obtener clasificaciones fiables a partir de corpus anotado automáticamente.

    • English

      In this paper we will show how clustering techniques provide empirical evidence for a characterisation of Discourse Markers (DMs) that helps in overcoming the lack of consensus and reduces the cost of building NLP resources based on DMs. By comparison of classifications from hand-tagged and unsupervised corpora we are capable of grounding a notion of DM prototypicality, from which reliable classifications can be obtained from fully unsupervised corpora.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno