Ayuda
Ir al contenido

Dialnet


Resumen de Un análisis Comparativo de Estrategias para la Categorización Semántica de textos Cortos

María V. Rosas, Marcelo Luis Errecalde

  • español

    La categorización de textos cortos es, hoy en día un área importante de investigación debido a que gran parte de la información que recibimos y con la cual trabajamos habitualmente tiene esta característica (e-mails, mensajes de texto, resúmenes de noticias, entre otros). Distintos trabajos han reportado resultados interesantes en la categorización de textos incorporando información semántica a la representación de los documentos. Sin embargo, estos trabajos no se han concentrado en general en las particularidades que presentan los textos cortos. Por otra parte, los métodos de desambiguación más difundidos (basados en corpus) no siempre son adecuados en los dominios que se intentan abordar. En estos casos, la desambiguación basada en conocimiento se convierte en una alternativa interesante a considerar. En este trabajo, estudiamos la efectividad de la categorización de textos cortos, cuando se utiliza información semántica obtenida con métodos basados en conocimiento. Los resultados obtenidos con este enfoque muestran mejoras interesantes que incentivan a continuar con esta línea de investigación.

  • English

    Nowadays, short-texts categorization is an important research area because most of the information we usually receive and work with have this characteristic (e-mails, text messages, news, etc.). Different studies have reported interesting results in text categorization by adding semantic information to documents’ representation. However, these studies have not focused on the particularities that short texts introduce. Furthermore, the most popular disambiguation methods (corpus-based methods) not always are feasible to use in these domains. Thus, knowledge-based disambiguation methods become interesting alternatives in these cases. In this article, we study the effectiveness of short text categorization, when semantic information, obtained by knowledge-based methods, is used. The results obtained with this approach show interesting improvements that encourage to continue this line of research.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus