Clasificación de documentos basada en la opinión: experimentos con un corpus de críticas de cine en español

Cruz Mata, Fermín; Troyano Jiménez, José Antonio; Enríquez de Salamanca Ros, Fernando; Ortega Rodríguez, Francisco Javier

Clasificación de documentos basada en la opinión: experimentos con un corpus de críticas de cine en español

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/8067

Información del item - Informació de l'item - Item information
Título:	Clasificación de documentos basada en la opinión: experimentos con un corpus de críticas de cine en español
Título alternativo:	Experiments in sentiment classification of movie reviews in Spanish
Autor/es:	Cruz Mata, Fermín \| Troyano Jiménez, José Antonio \| Enríquez de Salamanca Ros, Fernando \| Ortega Rodríguez, Francisco Javier
Palabras clave:	Clasificación de documentos basada en la opinión \| Orientación semántica \| Construcción de corpus \| Sentiment analysis \| Sentiment classification \| Opinion mining \| Semantic orientation \| Corpus building
Fecha de publicación:	sep-2008
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	CRUZ MATA, Fermín, et al. “Clasificación de documentos basada en la opinión: experimentos con un corpus de críticas de cine en español”. Procesamiento del lenguaje natural. N. 41 (sept. 2008). ISSN 1135-5948, pp. 73-80
Resumen:	En los últimos años se ha producido un creciente interés por el procesamiento automático de las opiniones contenidas en documentos de texto, en parte como consecuencia del aumento exponencial de contenidos generados por usuarios en la Web 2.0, y por el interés entre otros de empresas y gobiernos en analizar, filtrar o detectar automáticamente las opiniones vertidas por sus clientes o ciudadanos. Tomando como punto de partida trabajos de otros autores para el inglés, en el presente artículo exponemos los resultados obtenidos en la experimentación con un clasificador no supervisado de documentos basado en la opinión para el español. Proponemos también una versión supervisada del clasificador que obtiene un resultado sensiblemente mejor. Como paso previo a la experimentación, y ante la ausencia de recursos en español para desarrollar nuestro trabajo, presentamos un corpus de críticas de cine en español, que ha sido puesto a disposición de la comunidad científica. \| In recent years, automatic processing of opinions in text documents has received a growing interest. Some possible causes are the exponential increase of user-generated contents in Web 2.0, and also the interest of companies and governments in automatically analysing, filtering or detecting opinions from their customers or citizens. On the basis of some similar works in English by other authors, in this paper we expose the results obtained in the experimentation with an unsupervised sentiment classifier for Spanish. We also propose a supervised version of the classifier that shows a significatively better performance. Experiments have been carried out using a corpus that we have extracted from a web of movie reviews in Spanish. We have made this corpus available to the research community.
URI:	http://hdl.handle.net/10045/8067
ISSN:	1135-5948
Idioma:	spa
Tipo:	info:eu-repo/semantics/article
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 41 (septiembre 2008)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_41_09.pdf		280,36 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo