Técnicas de clasificación de opiniones aplicadas a un corpus en español
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/18524
Título: | Técnicas de clasificación de opiniones aplicadas a un corpus en español |
---|---|
Título alternativo: | Opinion classification techniques applied to a Spanish corpus |
Autor/es: | Martínez Cámara, Eugenio | Martín Valdivia, María Teresa | Perea Ortega, José Manuel | Ureña López, Luis Alfonso |
Palabras clave: | Minería de opiniones | Clasificación de la polaridad | Corpus de opiniones en español | Análisis de sentimientos | Opinion mining | Sentiment polarity classification | Opinion corpus in Spanish | Sentimental analysis |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | sep-2011 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | MARTÍNEZ CÁMARA, Eugenio, et al. “Técnicas de clasificación de opiniones aplicadas a un corpus en español”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 163-170 |
Resumen: | El análisis de sentimientos es una nueva tarea que combina técnicas de minería de texto y Procesamiento del Lenguaje Natural (PLN). Aunque existen ya varios trabajos relacionados con la temática, la mayoría de ellos únicamente usan textos en inglés. Sin embargo, el número de páginas webs, blogs u opiniones vertidas en Internet que usan cualquier idioma, no sólo el inglés, crece exponencialmente. De hecho, otros idiomas como el español incrementan su presencia en la red día a día. Es por ello que en este trabajo se presenta un estudio experimental sobre un corpus de opiniones sobre películas escrito en español. Nuestro objetivo principal consiste en comprobar cómo se comportan varios clasificadores entrenados para determinar la polaridad de las opiniones en dicho corpus. Para ello hemos usado dos clasificadores (SVM y Naïve Bayes) variando además distintos parámetros como el esquema de pesado o la utilización o no de stopper y stemmer. Los experimentos realizados muestran que SVM se comporta mejor que Naïve Bayes y que el uso de stopper y stemmer también mejora los resultados. | Sentiment analysis is a new challenging task related to Text Mining and Natural Language Processing (NLP). Although there are some current works, most of them only focus on English texts. However, web pages, blogs and opinions on the Internet are increasing every day in any language and not only in English. Other language like Spanish is increasingly present so we have carried out an experimental study with a Spanish films reviews corpus. Our main goal is to check the results obtained using several classifiers trained in order to determinate the opinion polarity. We have tested two classification algorithms (SVM, Naïve Bayes) and several weighting schemes and different linguistic preprocessing (stopper and stemmer). The accomplished experiments show that SVM works better than Naïve Bayes. In addition, the stopper and stemmer also obtain a slight improvement. |
Patrocinador/es: | Esta investigación ha sido parcialmente financiada por el Fondo Europeo de Desarrollo Regional (FEDER), proyecto TEXT-COOL 2.0 (TIN2009-13391-C04-02) del Gobierno Español, por la Junta de Andalucía, proyecto GeOasis (P08-TIC-41999), y por el Instituto de Estudios Giennenses, proyecto RFC/IEG2010. |
URI: | http://hdl.handle.net/10045/18524 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Revisión científica: | si |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 47 (2011) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_47_17.pdf | 538,71 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.