Twitter se ha convertido en un recurso con gran potencial a la hora de analizar los estados de opinión acerca de temas de actualidad. En el presente trabajo mostramos la metodología utilizada para la obtención de un corpus de mensajes de Twitter relacionados con las elecciones generales españolas del 20 de noviembre de 2011. Dado que el acceso a los mensajes en Twitter se realiza mediante consultas, hemos estudiado diversas estrategias de construcción de dichas consultas, tratando de maximizar la cobertura obtenida. Tras experimentar con diversos acercamientos, se propone un método basado en grafos que permite la captura de tweets relacionados con una temática determinada, adaptando dinámicamente las consultas utilizadas para incorporar automáticamente los temas relacionados que eventualmente vayan surgiendo. El recurso obtenido, de gran utilidad, entre otros, en trabajos de análisis del sentimiento, está públicamente disponible para su utilización.
witter has become a resource of great potential for analyzing opinion about hot topics. In this paper we show the methodology used for obtaning a corpus of Twitter messages related to the Spanish general elections of November 20, 2011. Given that access to Twitter messages is done through querying, we have studied various strategies for building such queries, trying to maximize the coverage. After experimenting with several approaches, we propose a graph-based method that allows retrieval of tweets related to a specific topic, dynamically adapting the queries to automatically include related topics that eventually arise. The obtained resource, very useful for, among others, sentiment analysis tasks, is publicy available for use.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados