Montserrat Guillén Estany, Jessica Pesantez
La información histórica de los asegurados constituye un entorno idóneo para el desarrollo de los algoritmos machine learning, cuya finalidad es extraer conocimiento a partir de bases de datos. En este artículo exploramos diversas aproximaciones a la predicción de la siniestralidad y las primas del ramo del automóvil, comparando su implementación en una muestra real, dividida aleatoriamente en muestras de entrenamiento y test. Proponemos medidas para ayudar en la valoración de los métodos y su implicación práctica para la predicción de eventos pocos frecuentes y el cálculo de primas. La principal conclusión es que la dispersión de precios, y concretamente la diferencia entre la prima pura máxima y mínima, puede llegar a ser muy diferente según el método predictivo utilizado.
Historical records of insured policy holders constitute an ideal environment for the development of machine learning algorithms. These procedures are implemented on databases in order to extract knowledge. Here we explore different approaches to the prediction of claims and premiums in the automotive industry, comparing their implementation in a real sample, randomly divided into training and testing. We propose measures to help in the evaluation of the methods and their practical implication for the prediction of rare events and premium calculation. The main conclusion is that the dispersion of prices, and specifically the difference between the maximum pure and minimum premium, can become very different according to the predictive method used.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados