Técnicas de clasificación de opiniones aplicadas a un corpus en español

Martínez Cámara, Eugenio; Martín Valdivia, María Teresa; Perea Ortega, José Manuel; Ureña López, Luis Alfonso

Técnicas de clasificación de opiniones aplicadas a un corpus en español

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/18524

Información del item - Informació de l'item - Item information
Título:	Técnicas de clasificación de opiniones aplicadas a un corpus en español
Título alternativo:	Opinion classification techniques applied to a Spanish corpus
Autor/es:	Martínez Cámara, Eugenio \| Martín Valdivia, María Teresa \| Perea Ortega, José Manuel \| Ureña López, Luis Alfonso
Palabras clave:	Minería de opiniones \| Clasificación de la polaridad \| Corpus de opiniones en español \| Análisis de sentimientos \| Opinion mining \| Sentiment polarity classification \| Opinion corpus in Spanish \| Sentimental analysis
Área/s de conocimiento:	Lenguajes y Sistemas Informáticos
Fecha de publicación:	sep-2011
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	MARTÍNEZ CÁMARA, Eugenio, et al. “Técnicas de clasificación de opiniones aplicadas a un corpus en español”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 163-170
Resumen:	El análisis de sentimientos es una nueva tarea que combina técnicas de minería de texto y Procesamiento del Lenguaje Natural (PLN). Aunque existen ya varios trabajos relacionados con la temática, la mayoría de ellos únicamente usan textos en inglés. Sin embargo, el número de páginas webs, blogs u opiniones vertidas en Internet que usan cualquier idioma, no sólo el inglés, crece exponencialmente. De hecho, otros idiomas como el español incrementan su presencia en la red día a día. Es por ello que en este trabajo se presenta un estudio experimental sobre un corpus de opiniones sobre películas escrito en español. Nuestro objetivo principal consiste en comprobar cómo se comportan varios clasificadores entrenados para determinar la polaridad de las opiniones en dicho corpus. Para ello hemos usado dos clasificadores (SVM y Naïve Bayes) variando además distintos parámetros como el esquema de pesado o la utilización o no de stopper y stemmer. Los experimentos realizados muestran que SVM se comporta mejor que Naïve Bayes y que el uso de stopper y stemmer también mejora los resultados. \| Sentiment analysis is a new challenging task related to Text Mining and Natural Language Processing (NLP). Although there are some current works, most of them only focus on English texts. However, web pages, blogs and opinions on the Internet are increasing every day in any language and not only in English. Other language like Spanish is increasingly present so we have carried out an experimental study with a Spanish films reviews corpus. Our main goal is to check the results obtained using several classifiers trained in order to determinate the opinion polarity. We have tested two classification algorithms (SVM, Naïve Bayes) and several weighting schemes and different linguistic preprocessing (stopper and stemmer). The accomplished experiments show that SVM works better than Naïve Bayes. In addition, the stopper and stemmer also obtain a slight improvement.
Patrocinador/es:	Esta investigación ha sido parcialmente financiada por el Fondo Europeo de Desarrollo Regional (FEDER), proyecto TEXT-COOL 2.0 (TIN2009-13391-C04-02) del Gobierno Español, por la Junta de Andalucía, proyecto GeOasis (P08-TIC-41999), y por el Instituto de Estudios Giennenses, proyecto RFC/IEG2010.
URI:	http://hdl.handle.net/10045/18524
ISSN:	1135-5948
Idioma:	spa
Tipo:	info:eu-repo/semantics/article
Revisión científica:	si
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 47 (2011)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_47_17.pdf		538,71 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo