Barcelona, España
La tarea de normalización de contenido publicado por el usuario es un paso fundamental previo al análisis de las publicaciones en los medios sociales, especialmente en Twitter. En este trabajo se presenta un método para la normalización morfológica de tweets mediante el uso de recursos publicados en la Web y desarrollados de manera colectiva, entre los que se encuentran la Wikipedia y un diccionario de SMS. Los resultados obtenidos demuestran que estos recursos son una fuente de conocimiento muy valiosa para la generación de los diccionarios utilizados en la tarea de normalización.
The task of normalising user-generated content is a crucial step before analysing social media posts, particularly on Twitter. This paper presents a method for the morphological of tweets by the use of on-line and collectively developed resources, including Wikipedia and a SMS lexicon. The results obtained demonstrate that these resources are a valuable source of knowledge for generating the dictionaries used in the normalisation task.
© 2001-2026 Fundación Dialnet · Todos los derechos reservados