Ayuda
Ir al contenido

Dialnet


Character and Word Baselines Systems for Irony Detection in Spanish Short Texts

  • Autores: Gabriela Jasso López, Iván Meza Ruiz
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 56, 2016, págs. 41-48
  • Idioma: inglés
  • Títulos paralelos:
    • Sistemas de detección de ironía basados en palabras y caracteres para textos cortos en español
  • Enlaces
  • Resumen
    • español

      La ironía verbal es un fenómeno lingüístico en donde el significado expresado es el opuesto al significado literal del mensaje. Es un reto para el Procesamiento de Lenguaje Natural ya que se debe enseñar a un sistema una forma de reconocer y procesar el cambio de polaridad de lo expresado. Aun cuando han habido esfuerzos recientes en la identificación de ironía y sarcasmo, ninguno de estos aborda el problema en español. En este trabajo nos enfocamos en establecer un sistema base de clasificación usando características simples al nivel de palabras y caracteres para entradas en español de la red social Twitter. Presentamos sistemas basados en máquinas de soporte vectorial y selvas aleatorias usando n-gramas, así como un enfoque distribucional (i.e., word2vec).

    • English

      Verbal irony is the linguistic phenomenon in which the expressed meaning is the opposite of the literal meaning. Irony is a challenging task for Natural Language Processing, since one must teach a system to identify and process the polarity of the expression. Although there have been recent efforts in irony and sarcasm identification, none of them tackle the issue in Spanish. In this work we focus on producing classification baseline systems using straight-forward word and character features for Spanish posts from the social network Twitter. We present a set of n-gram baselines using support vector machines and random forests classifiers, as well as for a distributional approach (i.e., word2vec).


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno