Este trabajo presenta dos algoritmos para el tratamiento de los datos excéntricos que pudieran existir en una colección de datos de tamaño masivo. Los dos algoritmos desarrollados son el denominado PAELLA para la detección de los outliers, y el CiTree para clasificación de los datos. Ambos algoritmos funcionan secuencialmente, realizándose una clasificación y posteriormente la detección de los excéntricos. Los resultados obtenidos suponen una considerable mejora respecto al algoritmo más ampliamente utilizado para este tipo de trabajos, que es el algoritmo BACON, presentado una mayor estabilidad de funcionamiento a medida que crece la dimensionalidad del problema, gracias a su capacidad de adaptación mediante la adecuación de sus parámetros. Además permite la creación de reglas para determinar la causa que generó la excentricidad de las muestras identificadas como tales.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados