Clasificación automatizada de marcadores discursivos
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/81354
Título: | Clasificación automatizada de marcadores discursivos |
---|---|
Título alternativo: | Automatic categorization of discourse markers |
Autor/es: | Robledo, Hernán | Nazar, Rogelio |
Palabras clave: | Marcadores del discurso | Métodos cuantitativos | Métodos inductivos | Clasificación multicategorial | Discourse markers | Inductive methods | Quantitative methods | Multilabel categorization |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | sep-2018 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | Procesamiento del Lenguaje Natural. 2018, 61: 109-116. doi:10.26342/2018-61-12 |
Resumen: | Presentamos un método de clasificación de marcadores del discurso. A partir de una taxonomía generada inductivamente en un trabajo anterior, desde un corpus paralelo de gran tamaño y utilizando una técnica de clustering, proponemos ahora un sistema que permite clasificar un marcador discursivo no incluido en esa taxonomía en alguna de las categorías emergentes. Está basado en el cálculo de la similitud estadística entre el nuevo marcador y las categorías. Destacamos la naturaleza cuantitativa del enfoque, que permite la reproducción del experimento en otras lenguas. Además, el sistema propuesto es un clasificador multicategoría, y esto es importante ya que representa un primer acercamiento al estudio de la polifuncionalidad de los marcadores del discurso desde un enfoque empírico e inductivo. | We present a method for the categorization of discourse markers. Starting from the result of a previous research, in which we generated a taxonomy of discourse markers by inductive methods from parallel corpus, we propose now a method to classify new discourse markers in one or more of the categories discovered in our previous research. The method is based on the statistical similarity between a new marker and the emerging categories. We highlight the quantitative nature of the approach, because it will allow to replicate experiments in other languages. Furthermore, ours is a multi-label classification method, which is important because it represents a first approach to the study of the polyfunctionality of discourse markers from an empirical and inductive point of view. |
Patrocinador/es: | Este trabajo ha sido posible gracias a una Beca Doctoral Conicyt otorgada por el Gobierno de Chile al primer autor. |
URI: | http://hdl.handle.net/10045/81354 |
ISSN: | 1135-5948 |
DOI: | 10.26342/2018-61-12 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Derechos: | © Sociedad Española para el Procesamiento del Lenguaje Natural |
Revisión científica: | si |
Versión del editor: | https://doi.org/10.26342/2018-61-12 |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 61 (2018) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_61_12.pdf | 913,31 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.