Ayuda
Ir al contenido

Dialnet


Resumen de Sobre las propiedades discriminativas del análisis en componentes principales basado en la norma L1

José Luis Camargo Olivares

  • El análisis de componentes principales (PCA) basado en la norma L1 es una técnica cada vez más popular para el análisis de datos multivariantes. Como idea intuitiva se utiliza que, para las direcciones en las que la nube se extiende por el espacio, las proyecciones de esos puntos han de tener una gran varianza. Este criterio es muy efectivo, pero tiene el inconveniente de que la varianza es un estadístico poco robusto: si los datos están contaminados con valores atípicos (outliers), las estimaciones de la varianza tendrán un gran error. Como solución, se ha propuesto sustituir la varianza por el promedio del valor absoluto de las proyecciones. Esta técnica resultante es lo que se ha denominado PCA basado en la norma L1 o L1-PCA, consiguiendo algoritmos muy robustos. Esta Tesis demuestra que un vínculo entre L1-PCA y la transformada de Fukunaga-Koontz (FKT, del inglés Fukunaga-Koontz transform). En su formulación original, L1-PCA proyecta los datos de manera que maximiza, en promedio, el valor absoluto de las proyecciones. De esta forma, se consiguen resultados similares al PCA tradicional. Ahora bien, manteniendo el valor absoluto como función objetivo, pero cambiando maximizar por minimizar, L1-PCA proporciona un resultado equivalente al que se obtiene mediante FKT. La importancia práctica de este resultado es que la FKT estándar es una técnica supervisada, es decir, para estimar los parámetros de la transformación, requiere un conjunto de datos de entrenamiento pertenecientes a cada una de las clases correctamente etiquetados. Por el contrario, minimizar el valor absoluto puede llevarse a cabo de manera totalmente no supervisada, haciendo innecesarios por ello los datos de entrenamiento. De esta forma, se ofrece una alternativa completamente novedosa para el cálculo de la FKT. Esto abre nuevas líneas de investigación en el área del aprendizaje automático o 'machine learning'.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus