Ayuda
Ir al contenido

Dialnet


Exploiting web-based collective knowledge for micropost normalisation

    1. [1] Universitat Pompeu Fabra

      Universitat Pompeu Fabra

      Barcelona, España

    2. [2] Havas Media Group
  • Localización: XXIX Congreso de la Sociedad Española de Procesamiento de Lenguaje Natural: SEPLN 2013 / coord. por Alberto Díaz Esteban, Iñaki Alegría Loinaz, Julio Villena Román, 2013, ISBN 978-84-695-8349-4, págs. 47-51
  • Idioma: inglés
  • Títulos paralelos:
    • Uso del conocimiento colectivo recogido en recursos de la Web para la normalización de textos cortos publicados en Twitter
  • Texto completo no disponible (Saber más ...)
  • Resumen
    • español

      La tarea de normalización de contenido publicado por el usuario es un paso fundamental previo al análisis de las publicaciones en los medios sociales, especialmente en Twitter. En este trabajo se presenta un método para la normalización morfológica de tweets mediante el uso de recursos publicados en la Web y desarrollados de manera colectiva, entre los que se encuentran la Wikipedia y un diccionario de SMS. Los resultados obtenidos demuestran que estos recursos son una fuente de conocimiento muy valiosa para la generación de los diccionarios utilizados en la tarea de normalización.

    • English

      The task of normalising user-generated content is a crucial step before analysing social media posts, particularly on Twitter. This paper presents a method for the morphological of tweets by the use of on-line and collectively developed resources, including Wikipedia and a SMS lexicon. The results obtained demonstrate that these resources are a valuable source of knowledge for generating the dictionaries used in the normalisation task.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno