[1]
;
Saransig De La Torre , Yaritza Corina
[1]
;
Aguilar Reyes , Johanna Enith
[2]
;
Morocho Barrionuevo , Tania Paulina
[2]
;
Mejía Peñafiel , Edwin Fernando
[2]
El análisis predictivo y la modelización estadística son herramientas esenciales para comprender el comportamiento de los datos. Este estudio tiene como objetivo comparar dos métodos estadísticos ampliamente utilizados la regresión logística multinomial y los árboles de clasificación para identificar los factores que influyen significativamente en el rendimiento académico de los estudiantes que ingresan al curso de nivelación de la carrera de Estadística, y desarrollar un modelo aplicable en entornos educativos. La metodología es de tipo cuantitativo, ya que se basa en la recolección de datos numéricos mediante encuestas y su posterior análisis estadístico. Se realizó un análisis exploratorio y descriptivo, orientado a especificar las características y relaciones entre variables sociodemográficas, rendimiento previo y condiciones del entorno educativo. La investigación es experimental por la manipulación de variables, y deductiva, al fundamentarse en principios teóricos. Se utilizaron dos técnicas de modelado: regresión logística multinomial y árboles de clasificación. Los resultados mostraron que el modelo logístico alcanzó una precisión del 100% y un AUC de 1.0, lo que indica una capacidad perfecta de clasificación. En contraste, el árbol de clasificación obtuvo una precisión del 70.83% y un AUC de 0.7042, evidenciando una capacidad moderada. Se concluyó que los factores más influyentes en el rendimiento académico son los hábitos de estudio, el interés en la carrera y aspectos psicológicos. Además, la regresión logística multinomial resultó ser más efectiva y precisa para modelar la relación entre variables y rendimiento académico.
Predictive analysis and statistical modeling are essential tools for understanding data behavior. This study aims to compare two widely used statistical methods—multinomial logistic regression and classification trees—to identify the factors that significantly influence the academic performance of students entering the leveling course in the Statistics program and to develop a model applicable in educational settings. The methodology is quantitative, based on the collection of numerical data through surveys and subsequent statistical analysis. An exploratory and descriptive analysis was conducted to specify the characteristics and relationships among sociodemographic variables, prior academic performance, and educational environment conditions. The research is experimental due to the manipulation of variables, and deductive, as it is grounded in theoretical principles. Two modeling techniques were used: multinomial logistic regression and classification trees. The results showed that the logistic model achieved 100% accuracy and an AUC of 1.0, indicating perfect classification capability. In contrast, the classification tree model achieved an accuracy of 70.83% and an AUC of 0.7042, demonstrating moderate classification ability. It was concluded that the most influential factors in academic performance are study habits, interest in the academic program, and psychological aspects. Additionally, multinomial logistic regression proved to be more effective and accurate in modeling the relationship between variables and academic performance.
© 2001-2026 Fundación Dialnet · Todos los derechos reservados