¿Puede el Aprendizaje Automático Predecir Brechas de Ciberseguridad en los Sistemas de Información Empresariales? Un análisis de aprendizaje supervisado

Sonia Patricia Córdovez Machado; John Javier Cruz Garzón; Cristian Luis Inca Balseca

Ayuda

¿Puede el Aprendizaje Automático Predecir Brechas de Ciberseguridad en los Sistemas de Información Empresariales? Un análisis de aprendizaje supervisado

Córdovez Machado, Sonia Patricia ^[2] ; Cruz Garzón, John Javier ^[1] ; Inca Balseca, Cristian Luis ^[2]
1. [1] Escuela Politécnica del Ejército
  
  Escuela Politécnica del Ejército
  
  Sangolqui, Ecuador
2. [2] Escuela Superior Politécnica de Chimborazo (ESPOCH)
Localización: ASCE MAGAZINE, ISSN-e 3073-1178, Vol. 4, Nº. 3, 2025 (Ejemplar dedicado a: Edición Frecuencia de Julio/Septiembre), págs. 333-352
Idioma: español
Títulos paralelos:
- Can Machine Learning Predict Cybersecurity Breaches in Enterprise Information Systems? A Supervised Learning Analysis.
Enlaces
- Texto completo (pdf)
Resumen
- español
  Este artículo investiga la capacidad del aprendizaje automático supervisado para predecir brechas de ciberseguridad en entornos empresariales. Mediante un análisis comparativo de dos modelos, la Máquina de Vectores de Soporte (SVM) y el Bosque Aleatorio (Random Forest), el estudio evalúa su eficacia en un conjunto de datos simulado que integra variables técnicas, contextuales y de comportamiento humano. Ambos modelos alcanzan una notable precisión global del 88%, aunque con fortalezas distintas: el SVM destaca por su alta sensibilidad para detectar brechas reales, mientras que el Bosque Aleatorio demuestra una consistencia y fiabilidad superiores. El hallazgo más significativo proviene del análisis de importancia de variables del Bosque Aleatorio, que revela que el factor humano —representado por la tasa de clics en phishing— es el predictor más influyente, acaparando el 42% del poder predictivo. Este supera considerablemente a los factores técnicos como la gravedad o el número de vulnerabilidades. El estudio concluye que, si bien el aprendizaje automático es una herramienta potente para la predicción, su mayor valor reside en identificar los verdaderos focos de riesgo. Por ello, se recomienda que las estrategias de ciberseguridad se reorienten para priorizar la mitigación del riesgo humano, reconociéndolo no solo como una vulnerabilidad, sino como el principal indicador predictivo de un incidente.
- English
  This article investigates the ability of supervised machine learning to predict cybersecurity breaches in enterprise environments. Through a comparative analysis of two models, the Support Vector Machine (SVM) and the Random Forest, the study evaluates their effectiveness on a simulated dataset that integrates technical, contextual, and human behavioral variables. Both models achieve a remarkable overall accuracy of 88%, albeit with different strengths: the SVM stands out for its high sensitivity in detecting real breaches, while the Random Forest demonstrates superior consistency and reliability. The most significant finding comes from the variable importance analysis of the Random Forest, which reveals that the human factor—represented by the phishing click-through rate—is the most influential predictor, accounting for 42% of the predictive power. This considerably outperforms technical factors such as severity or number of vulnerabilities. The study concludes that, while machine learning is a powerful toolfor prediction, its greatest value lies in identifying true risk hotspots. Therefore, it is recommended that cybersecurity strategies be reoriented to prioritize human risk mitigation, recognizing it not only as a vulnerability, but as the main predictiveindicator of an incident.