Las opiniones textuales imponen grandes retos a las aplicaciones de minería de opinión ya que varios problemas están presentes; entre ellos: la escritura de opiniones de manera irónica o sarcástica. Una de las tendencias que existen para detectar la ironía consiste en la clasificación basada en rasgos. En investigación anterior se propone un conjunto de rasgos que permiten detectar ironía en opiniones textuales; sin embargo, el cálculo de estos rasgos es costoso computacionalmente. Por lo que en este artículo nos proponemos estudiar dicho conjunto de rasgos con el objetivo de detectar un subconjunto de éste que discrimine entre textos cortos irónicos y no irónicos, sin afectar la eficacia de los clasificadores. El principal resultado de este trabajo consiste en la obtención de un subconjunto de rasgos que logre detectar de manera efectiva la ironía, mediante la aplicación de técnicas de selección y de ranking de rasgos, y la evaluación de varias técnicas de aprendizaje supervisado. El conjunto obtenido de siete rasgos es suficiente para discriminar entre opiniones irónicas y no irónicas, obteniéndose resultados estadísticamente comparables con aquellos obtenidos al utilizar un conjunto mayor y más complejo de rasgos.
Textual opinions impose great challenges to opinion mining applications since several problems are present; among them: writing opinions ironically or sarcastically. One of the trends that exist to detect irony is the classification based on features. In previous research a set of features that allow detecting irony in textual opinions is proposed; however, the calculation of these features is computationally costly. In this paper, we propose to study this set of features to detect a subset of it that discriminates between ironic and non-ironic short texts, without affecting the effectiveness of the classifiers. The main result of this work consists of obtaining a subset of features that can effectively detect irony, through the application of selection and feature ranking techniques, and the evaluation of several supervised learning techniques. The set obtained from seven features is enough to discriminate between ironic and non-ironic opinions, obtaining statistically comparable results with those obtained by using a larger and more complex set of features.
© 2001-2025 Fundación Dialnet · Todos los derechos reservados