Ayuda
Ir al contenido

Dialnet


Consideraciones a la imputación múltiple. Un caso de estudio con datos panel

    1. [1] Instituto de Investigación de Estudios Superiores Económicos y Sociales de la Universidad Veracruzana
    2. [2] Instituto de Estadística de la Facultad de Ciencias Económicas y de Administración, Universidad de la República
    3. [3] Departamento de Neurocognición, Universidad Católica del Uruguay
  • Localización: Cuadernos del CIMBAGE, ISSN-e 1669-1830, ISSN 1666-5112, Vol. 1, Nº. 24, 2022, págs. 33-47
  • Idioma: español
  • Títulos paralelos:
    • Considerations for multiple imputation. Case of study with panel data
  • Enlaces
  • Resumen
    • español

      Los datos faltantes son todo un reto en los análisis estadísticos. La imputación, entendida como el proceso de reemplazar los datos faltantes con un valor estimado, es un problema regular en los proyectos de investigación. Existen muchos modelos y subrutinas de diversos software destinadas para este proceso, sin embargo, la selección del modelo de imputación adecuado al tipo de datos disponibles es trascendental para la fiabilidad del resultado. En este estudio se trabaja con una tabla de datos cruzada que involucran series de tiempo (datos panel) con un 24% de datos faltantes. Con el objetivo de imputar estos datos, se utilizó un modelo de imputación múltiple y se agregaron algunas restricciones al sistema. El principal aporte de este ejercicio es mostrar que un buen proceso de imputación requiere del diagnóstico del problema, de la configuración del modelo de imputación y, finalmente, de la verificación de la calidad de los datos imputados.

    • English

      Missing data is a challenge for statistical analysis. Imputation, as the process of replacing missing data with an estimated value, is a regular problem in any research project. There are many imputation models and packages that make this process. Nevertheless, the election of the adequate imputation model is transcendental for the results reliability. In this study we work with a Time-Series Cross-Section dataset (TSCS) and 24% of missing data. We used a multiple imputation model and aggregated some prior information to  the system. The principal contribution to this exercise is to show that a good imputation requires (beside the software) a problem diagnosis, the configurations of the model imputation, and finally, the diagnostic of the quality of the data imputation.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno