Ampliación de lexicones de opinión específicos de dominio usando representaciones continuas de palabras

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/57751
Información del item - Informació de l'item - Item information
Título: Ampliación de lexicones de opinión específicos de dominio usando representaciones continuas de palabras
Título alternativo: Expansion of domain-specific opinion lexicons using word embeddings
Autor/es: López Solaz, Tomás | Cruz Mata, Fermín | Enríquez de Salamanca Ros, Fernando
Palabras clave: Análisis del sentimiento | Lexicones de opinión | Representaciones continuas de palabras | Sentiment analysis | Opinion lexicons | Word embeddings
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2016
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2016, 57: 49-56
Resumen: En este trabajo abordamos la ampliación de lexicones de opinión específicos de dominio a partir de textos del dominio elegido. El método se basa en la construcción de clasificadores que catalogan las palabras de entrada como positivas, negativas o neutras, y en un criterio estricto de selección de las palabras que pretende garantizar la precisión de las nuevas incorporaciones al lexicón. Se utilizan representaciones continuas de palabras (word embeddings) como espacio de características de los clasificadores. Los resultados confirman que dichas representaciones contienen información relativa a la polaridad de las palabras, obteniéndose una precisión en la selección de los candidatos y en la estimación de su polaridad de alrededor del 94% para los tres dominios analizados, con una cobertura en torno al 50% de las palabras de opinión contenidas en los textos de partida. | In this work we present a domain-specific opinion lexicon expansion method. The method is based on classifiers which categorize words as positive, negative or neutral, and a strict selection criteria of words intended to ensure the precision of the new additions to the lexicon. We use word embeddings as the feature space of the classifiers. The results confirm that these representations contain information on the polarity of the words, obtaining a precision in the selection of candidates and the estimation of its polarities of about 94% for the three domains analyzed, covering around 50% of the opinion words contained in the initial texts.
Patrocinador/es: Este trabajo ha sido financiado a través del proyecto de investigación AORESCU (P11-TIC-7684 MO).
URI: http://hdl.handle.net/10045/57751
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 57 (2016)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_57_05.pdf1,7 MBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.