Ayuda
Ir al contenido

Dialnet


Algoritmo híbrido basado en aprendizaje computacional para el manejo de datos faltantes en aplicaciones OLAP

    1. [1] Universidad Distrital Francisco José de Caldas

      Universidad Distrital Francisco José de Caldas

      Colombia

  • Localización: Ingeniare: Revista Chilena de Ingeniería, ISSN-e 0718-3305, ISSN 0718-3291, Vol. 24, Nº. 4, 2016, págs. 628-642
  • Idioma: español
  • Títulos paralelos:
    • Hybrid algorithm based machine learning for missing data management applications OLAP
  • Enlaces
  • Resumen
    • español

      El artículo presenta el desarrollo y uso de un algoritmo híbrido de aprendizaje computacional para la tarea de relleno de valores faltantes realizada durante la fase de preparación de datos. En primer lugar, se aborda el problema a resolver, el que está orientado al estudio y análisis de diferentes técnicas para el relleno de valores faltantes, con el fin de proponer una técnica híbrida como producto de esta investigación para dicha tarea y asociarla con la tecnología OLAP (Procesamiento Analítico en Línea). Luego, se justifica la metodología de investigación (científica descriptiva-exploratoria con enfoque experimental) aplicada en este proyecto. Se realizó la revisión de técnicas utilizadas en el relleno de valores faltantes; con base en la verificación de las técnicas y los casos de estudio, se seleccionaron métodos basados en vecindad y redes neuronales artificiales, y se propuso una técnica híbrida (KMediasSom) aplicada a un conjunto de datos sintético y a uno real, provenientes de una aplicación OLAP. En seguida, se plantean las pruebas de análisis y resultados con el fin de precisar su aplicabilidad en cuanto a efectividad y complejidad algorítmica se refiere. Finalmente, se presentan las conclusiones, donde se demostró que la técnica híbrida genera mejores resultados que las técnicas usadas por separado.

    • English

      This paper shows the development and use of a hybrid algorithm of machine learning for the missing values predict task, with this task that is carried out while the data preprocessing phase. Firstly, we go through the problem to solve, which is pointed to the study and analysis of different techniques for the missing values predict in order to suggest a hybrid technique as a product of this research for the task and link it to the OLAP (On-Line Analytical Processing) technology. Then, justifying the research methodology (scientific descriptive - probing) applied in this project. The techniques review was carried out filling out the missing values; based on the techniques proof and the study cases, k-Nearest Neighbors algorithms and artificial neural networks were selected and a hybrid technique (KMediaSom) was suggested, applied to a synthetic data set and a real one, coming from a OLAP; for the algorithms implementation was used Matlab. Right away, the analysis and results are set out in order to specify its applicability about efficacy and time complexity. Results are suitable as for the synthetic data set as for the real one; according to the test signs achieved. Finally, the conclusions, where it i'sproved that the technique or hybrid algorithms generate better results than the techniques used by separately.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno