Ayuda
Ir al contenido

Dialnet


Resumen de Métricas para el apoyo de la exploración visual de componentes en modelos de minería de datos

Fernando Medina Quispe, Wilson Castillo Rojas, Claudio Meneses Villegas

  • español

    La exploración de un modelo de Minería de Datos (MD), mediante el uso de técnicas de representación visual apropiadas y mecanismos de interacción integrados, presentan ventajas para el analista o minero de datos al momento de intentar comprender un modelo datos. Actualmente, existen nuevas propuestas de metodologías y esquemas de visualización para apoyar procesos de MD, que integran características que combinan técnicas de MD y artefactos gráficos ad-hoc con el objetivo de facilitar el análisis y exploración de modelos, mediante el uso de visualización en la entrada (análisis exploratorio de datos) del proceso de MD, luego en el proceso de generación del modelo (visualización y exploración del modelo y de sus componentes internas), y finalmente en la salida de este proceso (visualización de patrones). Sin embargo, esto apunta a un análisis cualitativo y muchas veces subjetivo, que depende directamente de la experiencia y experticia del analista o minero de datos. Para poder complementar este análisis cualitativo, es necesario incorporar en el esquema visual, funciones con métricas que permitan corroborar cuantitativamente. Este trabajo se orienta en esta dirección, y describe la definición, adaptación, e implementación de un conjunto de métricas que permiten validar y complementar el análisis visual de un modelo de MD, mediante el uso de métricas de distancia y similitud, aplicadas sobre las componentes del modelo de MD. Este trabajo utiliza como caso de estudio, un modelo de MD generado a través de la técnica Árbol de Decisión (ÁD), combinada con la técnica mapas de Kohonen o Self-Organizing Map (SOM) aplicada sobre las componentes o nodos del ÁD. Se logra comprobar la validez de las métricas propuestas a partir de su aplicación, sobre un conjunto de datos conocido a partir de una tarea de MD previamente definida.

  • English

    The exploration of a Data Mining (DM) model, through the use of appropriate visual representation techniques and integrated interaction mechanisms, present advantages for the analyst or data miner when attempting to understand a data model. Currently, there are new proposals for methodologies and visualization schemes to support DM processes, which integrate features that combine DM techniques and ad-hoc graphic artifacts in order to facilitate the analysis and exploration of models, through the use of visualization in the input (exploratory data analysis) of the DM process, then in the model generation process (visualization and exploration of the model and its internal components), and finally in the output of this process (pattern visualization). However, this points to a qualitative and often subjective analysis, which depends directly on the experience and expertise of the analyst or data miner. In order to be able to complement this qualitative analysis, it is necessary to incorporate functions with metrics in the visual scheme that allow to corroborate it quantitatively. This work is oriented in this direction, and describes the definition, adaptation and implementation of a set of metrics that allow to validate and complement the visual analysis of an DM model, by using distance and similarity metrics, applied to the components of the MD model. This work uses as a case study, an DM model generated through the Decision Tree (DT) technique, combined with the Kohonen maps technique or Self-Organizing Map (SOM), applied to the components or nodes of the DT. It is possible to check the validity of the proposed metrics from their application on a known data set from a previously defined DM task.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus