Ciudad Real, España
Madrid, España
Propósito Este artículo tiene como objetivo predecir la insolvencia corporativa comparando Machine Learning y fórmulas analíticas aplicadas a 8 ratios financieros.
Diseño/metodología/enfoque Se utiliza un conjunto de datos de 388.145 empresas españolas solventes y 842 insolventes en un total de 27 simulaciones, empleando 3 fórmulas analíticas (Springate, Grover, Amat), 3 modelos de Machine Learning (K Nearest Neighbors, Random Forest, Mutli Layer Perceptron) y 3 enfoques de muestreo (conjunto de datos original, reducción de datos y aumento de muestreo).
Hallazgos El desequilibrio del conjunto de datos entre empresas solventes e insolventes es importante en las capacidades de predicción de los modelos de Machine Learning; cuando se equilibran mediante una reducción de las empresas solventes o un aumento de las insolventes, los modelos de aprendizaje automático superan los resultados de los analíticos. Los modelos de Machine Learning con mejor rendimiento se basan en los ratios definidos en el modelo de Amat, una particularización del Z-Score de Altman para las empresas españolas.
Originalidad Este artículo compara diferentes enfoques de muestreo, mientras que la literatura se centra más en la reducción de datos en el muestreo debido a la disponibilidad de información. Este artículo también predice la insolvencia a partir de una pequeña cantidad de ratios financieros, en lugar de utilizar muchas variables financieras, como es m ́as común en la literatura.
Purpose This paper aims to predict corporate insolvency by comparing machine learning (ML) and analytical formulas applied on 8 financial ratios.
Design/methodology/approach This study uses a dataset of 388,145 solvent and 842 insolvent Spanish companies in a total of 27 simulations, employing 3 analytical formulas (Springate, Grover, Amat), 3 ML models (K-nearest neighbours (KNN), random forest (RF), multi-layer perceptron (MLP)) and 3 sampling approaches (original dataset, downsampling and upsampling).
Findings The dataset imbalance between solvent and insolvent companies matters in the prediction capabilities of the ML models; when balanced through downsampling of solvent companies or upsampling the insolvent ones, the ML models outperform the results of the analytical ones. The best performing ML models are built upon the ratios defined in Amat model, a particularization of Altman’s Z-score to Spanish companies.
Originality/value This paper compares different sampling approaches, whereas literature is more focused on downsampling due to information availability. This paper also predicts insolvency from a small amount of financial ratios, rather than using many financial variables, more common in literature.
© 2001-2026 Fundación Dialnet · Todos los derechos reservados