Ayuda
Ir al contenido

Dialnet


Análisis de Componentes Principales en presencia de datos faltantes: el principio de datos disponibles

    1. [1] Universidad del Valle (Colombia)

      Universidad del Valle (Colombia)

      Colombia

  • Localización: Scientia et Technica, ISSN 0122-1701, Vol. 26, Nº. 2, 2021, págs. 219-228
  • Idioma: español
  • Títulos paralelos:
    • Principal Components Analysis in the presence of missing data: the principle of available data
  • Enlaces
  • Resumen
    • español

      En este trabajo proponemos utilizar el principio de datos disponibles derivado del algoritmo NIPALS (Nonlinear estimation by Iterative Partial Least Square) para trabajar el Análisis de Componentes Principales (ACP) en presencia de datos faltantes. Esta propuesta es importante puesto que no realiza imputación de datos, ni se descartan individuos de la base datos, el método propuesto trabaja con los elementos pares disponibles para conformar las matrices de cuasicorrelación en ?? y ?? en la descomposición espectral de estas matrices permite a través de las relaciones de transición realizar un ACP convencional. Del estudio de simulación realizado se encontró que a medida que aumenta el porcentaje de datos faltantes disminuye la inercia explicada en el primer plano factorial. Se desarrolló el algoritmo de solución bajo el entorno de programación R y se anexa el código para uso libre.

    • English

      In this paper we propose to use the principle of available data derived from the NIPALS (Nonlinear estimation by Iterative Partial Least Square) algorithm to work on the Principal Components Analysis (PCA) in the presence of missing data. This proposal is important since it does not perform data imputation, nor are individuals discarded from the database; the proposed method works with the available pairs to form the quasicorrelation matrices in ?? and in ??; the spectral decomposition of these matrices allows through the transition relations to realize a conventional PCA. From the simulation study carried out, it was found that as the percentage of missing data increases, the inertia explained in the first factorial plane decreases. The solution algorithm was developed under the R programming environment and the code is appended for free use.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno