Consideraciones a la imputación múltiple. Un caso de estudio con datos panel

Diana Donají Del Callejo Canal; Margarita Edith Canal Martínez; Elena Vernazza; Alar Urruticoechea; Ramón Álvarez Vaz

Ayuda

Consideraciones a la imputación múltiple. Un caso de estudio con datos panel

Del Callejo Canal, Diana ^[1] ; Canal-Martínez, Margarita Edith ^[1] ; Vernazza, Elena ^[2] ; Urruticoechea, Alar ^[3] ; Álvarez-Vaz, Ramón ^[2]
1. [1] Instituto de Investigación de Estudios Superiores Económicos y Sociales de la Universidad Veracruzana
2. [2] Instituto de Estadística de la Facultad de Ciencias Económicas y de Administración, Universidad de la República
3. [3] Departamento de Neurocognición, Universidad Católica del Uruguay
Mostrar afiliaciones +
Localización: Cuadernos del CIMBAGE, ISSN-e 1669-1830, ISSN 1666-5112, Vol. 1, Nº. 24, 2022, págs. 33-47
Idioma: español
Títulos paralelos:
- Considerations for multiple imputation. Case of study with panel data
Enlaces
- Texto completo (pdf)
Resumen
- español
  Los datos faltantes son todo un reto en los análisis estadísticos. La imputación, entendida como el proceso de reemplazar los datos faltantes con un valor estimado, es un problema regular en los proyectos de investigación. Existen muchos modelos y subrutinas de diversos software destinadas para este proceso, sin embargo, la selección del modelo de imputación adecuado al tipo de datos disponibles es trascendental para la fiabilidad del resultado. En este estudio se trabaja con una tabla de datos cruzada que involucran series de tiempo (datos panel) con un 24% de datos faltantes. Con el objetivo de imputar estos datos, se utilizó un modelo de imputación múltiple y se agregaron algunas restricciones al sistema. El principal aporte de este ejercicio es mostrar que un buen proceso de imputación requiere del diagnóstico del problema, de la configuración del modelo de imputación y, finalmente, de la verificación de la calidad de los datos imputados.
- English
  Missing data is a challenge for statistical analysis. Imputation, as the process of replacing missing data with an estimated value, is a regular problem in any research project. There are many imputation models and packages that make this process. Nevertheless, the election of the adequate imputation model is transcendental for the results reliability. In this study we work with a Time-Series Cross-Section dataset (TSCS) and 24% of missing data. We used a multiple imputation model and aggregated some prior information to the system. The principal contribution to this exercise is to show that a good imputation requires (beside the software) a problem diagnosis, the configurations of the model imputation, and finally, the diagnostic of the quality of the data imputation.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: