Ayuda
Ir al contenido

Dialnet


Resumen de Predicción de enfermedades crónicas en entornos industriales altamente contaminados mediante aprendizaje automático

Daniel Tlanepantla Pantoja, Silvia Soledad Moreno Gutiérrez, Sócrates López Pérez, Hector Hugo Siliceo Cantero

  • español

    La contaminación ambiental es un factor de riesgo de las enfermedades crónicas (EC) que hoy en día son identificadas como la principal causa de muerte en el mundo, el 80% en países de bajos y medianos recursos, en personas de todas las edades. Dado que las zonas industriales mantienen un alto índice de contaminación del aire sus habitantes se consideran de alta vulnerabilidad, tal es el caso de la Zona Metropolitana de Tula Hgo., en México. A petición de la Organización Mundial de la Salud de integrar poblaciones vulnerables a la calidad de vida mediante estrategias innovadoras, el presente estudio tiene como objetivo construir modelos de predicción de EC de mayor frecuencia en la zona, para apoyar el diagnóstico predictivo mediante algoritmos de aprendizaje automático reconocidos por su alto desempeño en áreas de salud. Con base en la metodología CRISP-DM, se analizaron requerimientos, características y comportamiento de datos, se realizó limpieza exhaustiva y normalización minmax scaler, los modelos fueron entrenados y validados con 80% - 20% de registros, se aplicó dropout y early stopping para combatir el sobre entrenamiento. El análisis comparativo entre 9 modelos construidos demostró el mejor desempeño de 3 de ellos, uno para cada EC; la Red Neuronal Artificial (RNA) para enfermedades respiratorias y Random Forest (RF) para diabetes e hipertensión arterial. Sus resultados de exactitud, precisión, sensibilidad, especificidad y F1-score fueron 99%, 99%, 100%, 99% y 99.49% respectivamente para RNA, el modelo RF para diabetes obtuvo 98%, 100%, 97%, 100% y 98.7% y para hipertensión arterial 95%, 97%, 94, 97% y 95.47%, estos modelos se integraron a una interfaz gráfica. La propuesta constituye una estrategia tecnológica de alta precisión para prevención y diagnóstico precoz de EC en zonas industriales, orientada a reducir la mortalidad y mejorar la calidad de vida de los habitantes.

  • English

    Environmental pollution is a risk factor for chronic diseases (CD), which today are identified as the main cause of death in the world, 80% in low- and middle-income countries, in people of all ages. Given that industrial areas maintain a high rate of air pollution, their inhabitants are considered highly vulnerable, such is the case of the Metropolitan Area of Tula Hgo., in Mexico. At the request of the World Health Organization to integrate vulnerable populations to the quality of life through innovative strategies, the present study aims to build prediction models for CD of higher frequency in the area, to support predictive diagnosis through machine learning algorithms, recognized for their high performance in health areas. Based on the CRISP-DM methodology, requirements, characteristics and data behavior were analyzed, exhaustive cleaning and minmax scaler normalization were performed, the models were trained and validated with 80% - 20% of records, dropout and early stopping were applied to combat overtraining. The comparative analysis between 9 built models demonstrated the best performance of 3 of them, one for each EC; the Artificial Neural Network (ANN) for respiratory diseases and Random Forest (RF) for diabetes and high blood pressure. Its results of accuracy, precision, sensitivity, specificity and F1-score were 99%, 99%, 100%, 99% and 99.49% respectively for ANN, the RF model for diabetes obtained 98%, 100%, 97%, 100% and 98.7% and for arterial hypertension 95%, 97%, 94, 97% and 95.47%, these models were integrated into a graphical interface. The proposal constitutes a high-precision technological strategy for prevention and early diagnosis of CD in industrial areas, aimed at reducing mortality and improving the quality of life of the inhabitants.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus