Ir al contenido


Resumen de Noytext: A Web platform to annotate social media documents on noise perception for their use in opinion mining research

L. Gascó, C. Asensio, G. De Arcas, Carmen Claver Cabrero

  • español

    La explosión de las redes sociales online ha facilitado que la ciudadanía comparta su punto de vista sobre los problemas que sufre en su día a día, incluyendo las molestias hacia el ruido. La evolución tecnológica ha facilitado la implantación de tecnologías como el Procesado de Lenguaje Natural y el Machine Learning, que han permitido analizar los textos provenientes de redes sociales online y detectar la opinión que expresa la población sobre el ruido de su entorno en este canal de comunicación.

    Algunos de los algoritmos utilizados, como los basados en redes neuronales profundas, son algoritmos de aprendizaje automático supervisado. Esto significa que los investigadores tienen que proporcionar un conjunto de datos etiquetados para construir nuevos modelos de clasificación de textos. El proceso de anotación de datos es uno de los trabajos más laboriosos en un proyecto de ciencia de datos, ya que los investigadores, entre otras cosas, tienen que probar la conformidad entre los anotadores y comprobar que las categorías pre-definidas para clasificar los datos han sido definidas correctamente. Con intención de facilitar dicha tarea en este artículo se presenta Noytext, una herramienta web personalizable que permite anotar textos cortos provenientes de redes sociales online, que puede ser desplegada fácilmente en servidores propios y con la que se puede solicitar la ayuda de colegas y colaboradores en el proceso de anotación.

  • English

    Boost of online social networks has demonstrated that some people are willing to share their views about everyday problems, including noise. With the advent of Natural Language Processing and Machine Learning technologies to the majority of the scientific fields, we have begun to analyze the textual content of social media, and more specifically online social networks, to extract insights about the noise attitude of the population that uses this channel to express their opinion in this matter.

    Some of the state-of-the-art algorithms, such as deep neural networks, are supervised machine learning algorithms. This means that researchers have to provide a set of labelled training data to build new models. The annotation process is known as one of the most time-costly tasks in a data science pipeline, since researchers among other thigs have to test the agreement between annotators and to measure the quality of the categories they had previously defined. For that reason in this paper, we introduce Noytext which is a customizable web tool to annotate texts from your database, that can be deployed in your own webserver and you can use to request help from colleagues and collaborators in the annotation process in a friendly way.

Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus