AI-Driven Optimization in Distributed Computing Systems:: A Self-Tuning Framework

Mariano Garralda Barrio

Ayuda

AI-Driven Optimization in Distributed Computing Systems:: A Self-Tuning Framework

Autores: Mariano Garralda Barrio
Directores de la Tesis: Verónica Bolón-Canedo (tut. tes.), Carlos Eiras-Franco (dir. tes.)
Lectura: En la Universidade da Coruña ( España ) en 2026
Idioma: inglés
Número de páginas: 151
Tribunal Calificador de la Tesis: Mikel Galar Idoate (presid.), Noelia Sánchez-Maroño (secret.), Álvaro Ordóñez Iglesias (voc.)
Programa de doctorado: Programa Oficial de Doctorado en Computación
Enlaces
- Tesis en acceso abierto en: RUC
Resumen
- español
  El crecimiento exponencial de las cargas de trabajo intensivas en datos ha convertido la configuración de los sistemas de computación distribuida en un reto complejo y cada vez más sensible al coste. Esta tesis doctoral desarrolla un marco de autoajuste impulsado por inteligencia artificial que integra caracterización de cargas, aprendizaje por transferencia seguro y optimización híbrida para automatizar el ajuste de parámetros bajo restricciones reales de rendimiento y recursos. Apache Spark se emplea como plataforma empírica debido a su madurez industrial y amplia superficie de configuración. El enfoque caracteriza cada carga mediante un descriptor patrón–comportamiento que captura la estructura intrínseca de la ejecución en un espacio latente estable y comparable. La evidencia histórica se reutiliza de forma segura mediante mecanismos de similitud con garantías estadísticas que evitan la transferencia negativa ante cambios de escala o variabilidad del sistema. Sobre esta base, una capa de optimización híbrida combina exploración metaheurística con modelos predictivos inspirados en optimización bayesiana para guiar el autoajuste de manera eficiente y consciente del coste. La metodología resultante ofrece un enfoque responsable, reproducible y adaptativo que integra representación, modelado y optimización en un ciclo continuo alineado con los principios de IA Responsable y orientado a prácticas de sostenibilidad operativa en computación distribuida.
- English
  The exponential growth of data-intensive workloads has made the configuration of distributed computing systems a complex and increasingly cost-sensitive challenge. This doctoral thesis develops an AI-driven self-tuning framework that integrates workload representation, safe transfer learning, and hybrid optimization to automate configuration tuning under realistic performance and resource constraints. Apache Spark is used as the empirical platform due to its configurational richness and widespread adoption in large-scale analytics. The framework characterises each workload through a pattern–behavior descriptor that captures intrinsic execution structure in a stable and comparable latent space. Historical executions are reused safely through statistically grounded similarity mechanisms that prevent negative transfer under workload heterogeneity or scale variability. Building on this representation and modelling layer, a hybrid optimization component combines metaheuristic exploration with Bayesian-inspired surrogate guidance, enabling data-efficient and cost-aware configuration refinement. The resulting methodology provides a principled, reproducible, and adaptive approach to optimization in distributed systems. Rather than focusing on isolated performance gains, this thesis contributes an integrated framework that unifies representation, modelling, and optimization into a continuous learning process aligned with Responsible AI principles and supportive of sustainability oriented practices in distributed computing.
- galego
  O crecemento exponencial das cargas de traballo intensivas en datos converteu a configuración dos sistemas de computación distribuída nun desafío complexo e cada vez máis sensible ao custo. Esta tese doutoral propón un marco de autoaxuste baseado en intelixencia artificial que integra caracterización de cargas, aprendizaxe por transferencia segura e optimización híbrida para automatizar o axuste de parámetros baixo condicións reais de rendemento e recursos. Apache Spark emprégase como plataforma empírica pola súa adopción xeneralizada e a súa rica superficie configuracional. O método caracteriza cada carga cun descriptor patrón–comportamento que captura a estrutura intrínseca da execución nun espazo latente estable e comparable. A evidencia histórica reutilízase de maneira segura mediante mecanismos de similitude con garantías estatísticas que evitan transferencia negativa ante variacións de escala ou cambios no comportamento das cargas. Sobre esta base, unha capa de optimización híbrida combina exploración metaheurística con modelos preditivos inspirados na optimización bayesiana para guiar o autoaxuste de forma eficiente e consciente do custo. O resultado é unha metodoloxía responsable, reproducible e adaptativa, que integra representación, modelado e optimización nun proceso continuo aliñado cos principios da IA Responsable e orientado a prácticas de sustentabilidade operativa en computación distribuída.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: