Discourse marker characterisation via clustering : extrapolation from supervised to unsupervised corpora

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1737
Información del item - Informació de l'item - Item information
Título: Discourse marker characterisation via clustering : extrapolation from supervised to unsupervised corpora
Autor/es: Alonso Alemany, Laura | Castellón Masalles, Irene | Gibert Oliveras, Karina | Padró Cirera, Lluís
Palabras clave: Marcadores del discurso | Clustering | Discurso | Discourse markers | Discourse
Fecha de publicación: sep-2002
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: ALONSO ALEMANY, Laura, et al. “Discourse marker characterisation via clustering : extrapolation from supervised to unsupervised corpora”. Procesamiento del lenguaje natural. Nº 29 (sept. 2002), pp. 223-230
Resumen: En este artículo mostraremos cómo las técnicas de clustering pueden aportar evidencia empírica para una caracterización de los Marcadores del Discurso (DMs) que contribuya a superar la falta de consenso y reduzca el coste de construcción de los recursos de PLN basados en DMs. Hemos establecido una noción de prototipicalidad de DMs comparando las clasificaciones de corpus anotado manualmente y automáticamente, a partir de la cual podemos obtener clasificaciones fiables a partir de corpus anotado automáticamente. | In this paper we will show how clustering techniques provide empirical evidence for a characterisation of Discourse Markers (DMs) that helps in overcoming the lack of consensus and reduces the cost of building NLP resources based on DMs. By comparison of classifications from hand-tagged and unsupervised corpora we are capable of grounding a notion of DM prototypicality, from which reliable classifications can be obtained from fully unsupervised corpora.
Patrocinador/es: This research has been conducted thanks to a grant associated to the X-TRACT project, PB98-1226 of the Spanish Research Department. It has also been partially funded by projects HERMES (TIC2000-0335-C03-02) and PETRA (TIC2000-1735-C02-02).
URI: http://hdl.handle.net/10045/1737
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 29 (septiembre 2002)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_29_28.pdf1,08 MBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.