La contaminación ambiental es un factor de riesgo de las enfermedades crónicas (EC) que hoy en día son identificadas como la principal causa de muerte en el mundo, el 80% en países de bajos y medianos recursos, en personas de todas las edades. Dado que las zonas industriales mantienen un alto índice de contaminación del aire sus habitantes se consideran de alta vulnerabilidad, tal es el caso de la Zona Metropolitana de Tula Hgo., en México. A petición de la Organización Mundial de la Salud de integrar poblaciones vulnerables a la calidad de vida mediante estrategias innovadoras, el presente estudio tiene como objetivo construir modelos de predicción de EC de mayor frecuencia en la zona, para apoyar el diagnóstico predictivo mediante algoritmos de aprendizaje automático reconocidos por su alto desempeño en áreas de salud. Con base en la metodología CRISP-DM, se analizaron requerimientos, características y comportamiento de datos, se realizó limpieza exhaustiva y normalización minmax scaler, los modelos fueron entrenados y validados con 80% - 20% de registros, se aplicó dropout y early stopping para combatir el sobre entrenamiento. El análisis comparativo entre 9 modelos construidos demostró el mejor desempeño de 3 de ellos, uno para cada EC; la Red Neuronal Artificial (RNA) para enfermedades respiratorias y Random Forest (RF) para diabetes e hipertensión arterial. Sus resultados de exactitud, precisión, sensibilidad, especificidad y F1-score fueron 99%, 99%, 100%, 99% y 99.49% respectivamente para RNA, el modelo RF para diabetes obtuvo 98%, 100%, 97%, 100% y 98.7% y para hipertensión arterial 95%, 97%, 94, 97% y 95.47%, estos modelos se integraron a una interfaz gráfica. La propuesta constituye una estrategia tecnológica de alta precisión para prevención y diagnóstico precoz de EC en zonas industriales, orientada a reducir la mortalidad y mejorar la calidad de vida de los habitantes
© 2001-2024 Fundación Dialnet · Todos los derechos reservados