Clasificación automatizada de marcadores discursivos

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/81354
Información del item - Informació de l'item - Item information
Título: Clasificación automatizada de marcadores discursivos
Título alternativo: Automatic categorization of discourse markers
Autor/es: Robledo, Hernán | Nazar, Rogelio
Palabras clave: Marcadores del discurso | Métodos cuantitativos | Métodos inductivos | Clasificación multicategorial | Discourse markers | Inductive methods | Quantitative methods | Multilabel categorization
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2018
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2018, 61: 109-116. doi:10.26342/2018-61-12
Resumen: Presentamos un método de clasificación de marcadores del discurso. A partir de una taxonomía generada inductivamente en un trabajo anterior, desde un corpus paralelo de gran tamaño y utilizando una técnica de clustering, proponemos ahora un sistema que permite clasificar un marcador discursivo no incluido en esa taxonomía en alguna de las categorías emergentes. Está basado en el cálculo de la similitud estadística entre el nuevo marcador y las categorías. Destacamos la naturaleza cuantitativa del enfoque, que permite la reproducción del experimento en otras lenguas. Además, el sistema propuesto es un clasificador multicategoría, y esto es importante ya que representa un primer acercamiento al estudio de la polifuncionalidad de los marcadores del discurso desde un enfoque empírico e inductivo. | We present a method for the categorization of discourse markers. Starting from the result of a previous research, in which we generated a taxonomy of discourse markers by inductive methods from parallel corpus, we propose now a method to classify new discourse markers in one or more of the categories discovered in our previous research. The method is based on the statistical similarity between a new marker and the emerging categories. We highlight the quantitative nature of the approach, because it will allow to replicate experiments in other languages. Furthermore, ours is a multi-label classification method, which is important because it represents a first approach to the study of the polyfunctionality of discourse markers from an empirical and inductive point of view.
Patrocinador/es: Este trabajo ha sido posible gracias a una Beca Doctoral Conicyt otorgada por el Gobierno de Chile al primer autor.
URI: http://hdl.handle.net/10045/81354
ISSN: 1135-5948
DOI: 10.26342/2018-61-12
Idioma: spa
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2018-61-12
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 61 (2018)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_61_12.pdf913,31 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.