Ayuda
Ir al contenido

Dialnet


An artificial immune system based on information theory for keyword extraction from text documents

    1. [1] Universidad Nacional de Colombia

      Universidad Nacional de Colombia

      Colombia

  • Localización: Avances en Sistemas e Informática, ISSN 1909-0056, Vol. 4, Nº. 2, 2007, págs. 25-32
  • Idioma: inglés
  • Enlaces
  • Resumen
    • español

      En este artículo se presenta un modelo para la extracción de palabras clave; el cual extiende los conceptos básicos usados en dicha tarea, con el fin de proporcionar un marco teórico formal que permita determinar la importancia de las palabras clave para los documentos. El modelo propuesto combina un sistema inmune artificial con un fundamento matemático basado en la teoría de la información; este nuevo modelo tiene la ventaja de no requerir ningún conocimiento del dominio, así como el uso de un diccionario o cualquier información previa acerca del contenido de los documentos. El resultado final es un conjunto de palabras clave para cada categoría en el conjunto de datos usado.

    • English

      This paper presents a model for keyword extraction, extending the basic concepts commonly used in this task, in order to get a formal background that allows determining the importance of the keywords to the documents.

      The proposed model combines an artificial immune system with a mathematical background based on information theory; this new model has the advantage that does not need any domain knowledge, neither the use of a stopword list or any previous information about the content of the documents. The final result is a set of keywords for each category into the corpus used.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno