Ayuda
Ir al contenido

Dialnet


Clasificación de documentos basada en la opinión: experimentos con un corpus de críticas de cine en español

  • Autores: Fermín Cruz Mata, José Antonio Troyano Jiménez, Fernando Enríquez de Salamanca Ros, Francisco Javier Ortega Rodríguez
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 41, 2008, págs. 73-80
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      En los últimos años se ha producido un creciente interés por el procesamiento automático de las opiniones contenidas en documentos de texto, en parte como consecuencia del aumento exponencial de contenidos generados por usuarios en la Web 2.0, y por el interés entre otros de empresas y gobiernos en analizar, filtrar o detectar automáticamente las opiniones vertidas por sus clientes o ciudadanos. Tomando como punto de partida trabajos de otros autores para el inglés, en el presente artículo exponemos los resultados obtenidos en la experimentación con un clasificador no supervisado de documentos basado en la opinión para el español. Proponemos también una versión supervisada del clasificador que obtiene un resultado sensiblemente mejor. Como paso previo a la experimentación, y ante la ausencia de recursos en español para desarrollar nuestro trabajo, presentamos un corpus de críticas de cine en español, que ha sido puesto a disposición de la comunidad científica.

    • English

      In recent years, automatic processing of opinions in text documents has received a growing interest. Some possible causes are the exponential increase of user-generated contents in Web 2.0, and also the interest of companies and governments in automatically analysing, filtering or detecting opinions from their customers or citizens. On the basis of some similar works in English by other authors, in this paper we expose the results obtained in the experimentation with an unsupervised sentiment classifier for Spanish. We also propose a supervised version of the classifier that shows a significatively better performance. Experiments have been carried out using a corpus that we have extracted from a web of movie reviews in Spanish. We have made this corpus available to the research community.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno