Ayuda
Ir al contenido

Dialnet


Evaluación de diversas variantes de Indexado Aleatorio aplicadas a la categorización de documentos en el contexto del Aprendizaje en Línea

    1. [1] Centro de Estudios de Reconocimiento de Patrones y Minería de Datos.
    2. [2] Instituto Nacional de Óptica, Física y Electrónica.
    3. [3] Centro de Aplicaciones de Tecnologías de Avanzada
  • Localización: Revista Cubana de Ciencias Informáticas, ISSN-e 2227-1899, Vol. 10, Nº. 1, 2016
  • Idioma: español
  • Títulos paralelos:
    • Preliminary assessment of Random Indexing variants for Text Categorization in Online Learning Context
  • Enlaces
  • Resumen
    • español

      El Indexado Aleatorio es una técnica de reducción de dimencionalidad que permite obtener un espacio de representación para las palabras a partir de un conjunto de contexto en los cuales éstas aparecen. Esta técnica es computacionalmente menos costosa en comparación con otras como LSI, PLSI o LDA. Estas características la convierten en una atractiva opción para ser empleada en ambientes de categorización de textos. En este trabajo comparamos varias variantes de Indexado Aleatorio al ser aplicadas a la tarea de categorización de textos. Los experimentos realizados en una subcolección del conjunto de datos Reuter-21578 muestran que el Indexado Aleatorio obtiene resultados alentadores, identificando algunas variantes que no muestran las ventajas necesarias para ser aplicadas en la tarea de interés.

    • English

      Random Indexing is a recent technique for dimensionality reduction that allows to obtain a word space model from a set of contexts. This technique is less computationally expensive in comparison with others like LSI, PLSI or LDA. These characteristics turn it an attractive prospect to be used in text categorization. In this work, we compare several variants reported in the Random Indexing literature applied to text categorization task. Experiments conducted in a subcollection of the dataset Reuter-21578 show that Random Indexing produces promising results, identifying some versions without actual advantage for the task at hand.

Los metadatos del artículo han sido obtenidos de SciELO Cuba

Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno