Ayuda
Ir al contenido

Dialnet


Resumen de Polarity Classification of Tourism Reviews in Spanish

Iñaki San Vicente Roncal, Xavier Saralegi Urizar

  • español

    Este artículo presenta un clasificador de polaridad para críticas de recursos turísticos en español. Se ha creado una nueva colección de datos compuesta por críticas de recursos turísticos (hospedajes, restaurantes y actividades) del País Vasco en Español, extraídos de la web de críticas TripAdvisor. Adoptamos una estrategia supervisada y analizamos varios modelos configurados según diferentes atributos: un modelo de unigramas y otros basados en la información léxica proporcionada por un lexicón de polaridad adaptado al dominio del turismo. El sistema basado en el léxico obtiene un 83% de precisión para la tarea de clasificación de 3 categorías, y un 57% a la hora de clasificar 5 categorías. La mejora respecto al modelo de unigramas no es significativa, pero el número de atributos se reduce a la mitad, redundando en una mejora de la eficiencia. Asimismo, se ha evaluado el sistema para diferentes sub-dominios del turismo, que incluyen alojamientos, restaurantes y actividades.

  • English

    This article describes a polarity classifier for Spanish tourism reviews. We created a new data-set comprised by reviews of tourism resources (accommodations, restaurants, and activities) from the Basque Country in Spanish, by crawling the TripAdvisor review website. We adopt a supervised approach, and analyze various feature sets: an unigram model and various models that rely on the lexical information provided by a polarity lexicon, adapted to the tourism domain. The lexicon-based system achieves 83% accuracy for a 3-category classification task, and a 57% accuracy for a 5-category classification. Although the improvement over the unigram model is not significant it uses the half number of features which is more efficient. On top of that, evaluation is carried out for tourism resources sub-domains, including accommodation, restaurants and activities.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus