Ayuda
Ir al contenido

Dialnet


Prediction and interpretation of events through variable relevance analysis in machine learning models

  • Autores: Pedro Cadahia Delgado
  • Directores de la Tesis: Antonio Aníbal Golpe Moya (dir. tes.), Manuel Emilio Gegúndez Arias (dir. tes.)
  • Lectura: En la Universidad de Huelva ( España ) en 2022
  • Idioma: inglés
  • Número de páginas: 116
  • Programa de doctorado: Programa de Doctorado en Economía, Empresa, Finanzas y Computación por la Universidad de Huelva y la Universidad Internacional de Andalucía
  • Materias:
  • Enlaces
  • Resumen
    • español

      Las técnicas de regresión y clasificación se han estudiado en el aprendizaje automático para resolver diversas tareas. En particular, la creación de modelos basados tanto en la predicción como en la interpretabilidad es uno de los temas centrales de este trabajo. El desarrollo de esta literatura ha sido posible, debido a la necesidad tanto de predecir como de describir la realidad aprendida por los modelos estadísticos. En este sentido, la mayoría de los métodos de conjuntos de árboles de decisión representativos se han utilizado no sólo para predecir eventos, sino también para examinar la importancia de las variables con el fin de comprender los elementos que informan y hacen que sean relevantes para entender diversos fenómenos. Sin embargo, la literatura y las aplicaciones empíricas son todavía escasas. Por ello, esta tesis pretende analizar empíricamente estos modelos y desarrollar nuevos modelos que permitan avanzar en la comprensión de las relaciones y la relevancia entre variables en el campo de la econometría. En el capítulo 2 se propone un nuevo modelo preciso para las recesiones económicas en EE.UU. dando como resultado del trabajo los diferenciales de plazos del tesoro más importantes y las reglas para la detección de recesiones económicas en EE.UU., encontrando que el diferencial de plazos más relevante es el de 3 meses a 6 meses, el cual se propone para ser monitoreado por las autoridades económicas. El capítulo 3 propone un nuevo modelo preciso para estudiar la relevancia del precio, el PIB y la asequibilidad como mecanismo de control de la demanda de cigarrillos, encontrando que aunque las funciones de demanda estimadas hasta ahora son útiles para hacer predicciones sobre el comportamiento de la demanda de cigarrillos, el gobierno debe considerar que el precio es una buena herramienta para controlar el consumo de tabaco a partir de un determinado punto de asequibilidad. Por último, en el capítulo 4 se analiza si se cumplen las EPS establecidas en las provincias españolas y se miden las anomalías observadas en las provincias donde las ventas superan los valores esperados, encontrando que las provincias en las que se observan ventas por debajo de los valores rea-sonables (detectados por las EPS) presentan un claro patrón geográfico. Además, los valores proporcionados por las EPS en España, como se indica en la literatura anterior, están ligeramente sobredimensionados. Por último, hay regiones fronterizas con otros países o con una alta influencia turística en las que las ventas observadas son superiores a los valores esperados.

    • English

      Regression and Classification techniques has been studied in Machine learning in order to solve several tasks. In particular, the creation of models based both on predicting and interpretability is one of the central themes of this work. The development of this literature has been possible, due to the necessity of both predicting and describing the reality learnt by statistical models. In this regard, Most representative decision-tree ensemble methods has been used not only for predict events but also to examine the variable importance in order to understand the elements that inform and make it relevant to understand diverse phenomena. However, the literature and the empirical applications are still scarce. For this reason, this the-sis tries to empirically analyze these models and to develop new models that allow progress in the understanding of the relationships and relevance between variables in the field of econometrics. Chapter 2 proposes a new accurate model for US eco-nomic recessions giving as an output of the work the most important treasury term spreads and rules for US economic recession detection, finding the most relevant term spread found is 3-month–6-month, which is proposed to be monitoring by eco-nomic authorities. Chapter 3 proposes a new accurate model in order to study the relevance of price, GDP and affordability as a mechanism for controlling the demand for cigarettes, finding that although the demand functions estimated so far are useful to make predictions about the behavior of cigarette demand, the government must consider that price is a good tool to control tobacco consumption from a certain point of affordability. Finally, Chapter 4 analyze if the EPSs established in Spanish provinces were fulfilled and the anomalies observed in provinces where sales exceed expected values are measured, finding that the provinces in which sales below rea-sonable values are observed (as detected by the EPSs) present a clear geographical pattern. Furthermore, the values provided by the EPSs in Spain, as indicated in the previous literature, are slightly oversized. Finally, there are regions bordering other countries or with a high tourist influence in which the observed sales are higher than the expected values.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno