Arturo Montejo Ráez, Manuel Carlos Díaz Galiano, Eugenio Martínez Cámara, María Teresa Martín Valdivia, Miguel Ángel García Cumbreras, Luis Alfonso Ureña López
In this paper, we present the Twitter-normalization system developed by the SINAI group. Our system performs a series of conversions on the text by the use of translation lexicons and a spell checker. We obtain a poor result, only 37.6% of accuracy, and after the analysis of these results our system should be improved in areas such as the treatment of diminutives and superlatives, entities or abbreviations.
Este artículo presenta el sistema de normalización de tweets desarrollado por el grupo SINAI. Realizamos una serie de conversiones a partir de lexicones de traducción y un corrector ortográfico. Nuestro sistema obtiene un resultado de accuracy bajo, un 37.6%, y analizando los resultados necesita mejorarse en varios aspectos tales como diminutivos y superlativos, tratamiento de entidades o abreviaturas.
© 2001-2025 Fundación Dialnet · Todos os dereitos reservados