Ayuda
Ir al contenido

Dialnet


Comparación de tres modelos de texto para la generación automática de resúmenes

  • Autores: Romyna Montiel Soto, René Arnulfo García Hernández, Yulia Ledeneva, Rafael Cruz Reyes
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 43, 2009, págs. 303-311
  • Idioma: español
  • Títulos paralelos:
    • Comparison of three text models for automatic generation of summaries
  • Enlaces
  • Resumen
    • español

      Uno de los principales problemas en la generación automática de resúmenes de texto consiste en identificar, independientemente del idioma y dominio, la información más importante en el documento origen. Para este problema, una gran cantidad de trabajos han aplicado el modelo espacio vectorial basado en n gramas (secuencias de palabras de tamaño fijo). Una alternativa al modelo de n gramas es emplear solo las Secuencias de palabras que son Frecuentes y además Maximales (SFM's), las cuales permiten disminuir la dimensionalidad del modelo, a la vez que brindan información más relevante, puesto que el tamaño de cada SFM no es determinado previamente como sucede con n gramas. Este artículo presenta un estudio comparativo de estos modelos de textos para la generación automática de resúmenes extractivos con 567 documentos, empleando un algoritmo de aprendizaje no supervisado.

    • English

      One of the main issues on automatic text summarization consists in identify, independent from the language and domain, the most important information from the source document. For this problem many works have been applied the vector space model, which is based on n grams (word sequences of predetermined size). Other alternative to n grams model is to use only Maximal Frequent Sequences (MFS's), which let decrease the dimensionality of the model at the time, while give more relevant information, because the size of each MFS is not previously determined as it does with n grams. This work presents a comparative study of these text models for generating automatic extractive summaries with 567 documents, using an unsupervised learning algorithm.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno