Evaluación de diversas variantes de Indexado Aleatorio aplicadas a la categorización de documentos en el contexto del Aprendizaje en Línea

Adrian Fonseca; Aurelio López López; José E. Medina Pagola

Ayuda

Evaluación de diversas variantes de Indexado Aleatorio aplicadas a la categorización de documentos en el contexto del Aprendizaje en Línea

Adrian Fonseca Bruzón ^[1] ; Aurelio López López ^[2] ; José E. Medina Pagola ^[3]
1. [1] Centro de Estudios de Reconocimiento de Patrones y Minería de Datos.
2. [2] Instituto Nacional de Óptica, Física y Electrónica.
3. [3] Centro de Aplicaciones de Tecnologías de Avanzada
Mostrar afiliaciones +
Localización: Revista Cubana de Ciencias Informáticas, ISSN-e 2227-1899, Vol. 10, Nº. 1, 2016
Idioma: español
Títulos paralelos:
- Preliminary assessment of Random Indexing variants for Text Categorization in Online Learning Context
Enlaces
- Texto completo
Resumen
- español
  El Indexado Aleatorio es una técnica de reducción de dimencionalidad que permite obtener un espacio de representación para las palabras a partir de un conjunto de contexto en los cuales éstas aparecen. Esta técnica es computacionalmente menos costosa en comparación con otras como LSI, PLSI o LDA. Estas características la convierten en una atractiva opción para ser empleada en ambientes de categorización de textos. En este trabajo comparamos varias variantes de Indexado Aleatorio al ser aplicadas a la tarea de categorización de textos. Los experimentos realizados en una subcolección del conjunto de datos Reuter-21578 muestran que el Indexado Aleatorio obtiene resultados alentadores, identificando algunas variantes que no muestran las ventajas necesarias para ser aplicadas en la tarea de interés.
- English
  Random Indexing is a recent technique for dimensionality reduction that allows to obtain a word space model from a set of contexts. This technique is less computationally expensive in comparison with others like LSI, PLSI or LDA. These characteristics turn it an attractive prospect to be used in text categorization. In this work, we compare several variants reported in the Random Indexing literature applied to text categorization task. Experiments conducted in a subcollection of the dataset Reuter-21578 show that Random Indexing produces promising results, identifying some versions without actual advantage for the task at hand.

Los metadatos del artículo han sido obtenidos de SciELO Cuba

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: