Ayuda
Ir al contenido

Dialnet


Fault-tolerance and malleability in parallel message-passing applications

  • Autores: Iván Cores González
  • Directores de la Tesis: María J. Martín (dir. tes.), Patricia González (dir. tes.)
  • Lectura: En la Universidade da Coruña ( España ) en 2015
  • Idioma: inglés
  • Número de páginas: 135
  • Tribunal Calificador de la Tesis: Emilio Luque Fadón (presid.), Ramón Doallo (secret.), Sabela Ramos Garea (voc.)
  • Materias:
  • Enlaces
    • Tesis en acceso abierto en: RUC
  • Resumen
    • Esta tesis explora soluciones de tolerancia a fallos y maleabilidad basadas en técnicas de checkpoint y reinicio para aplicaciones de pase de mensajes. En el campo de la tolerancia a fallos, contribuye mejorando el factor que más incrementa la sobrecarga, el coste de E/S en el volcado de los ficheros de estado, proponiendo diferentes técnicas para reducir el tamaño de los ficheros de checkpoint. Ademós, también se propone nn mecanismo de migración de procesos basado en checkpointing. Esto permite la migración proactiva de procesos desde nodos que están a punto de fallar, evitando un reinicio completo de la ejecución y mejorando la resistencia a fallos de la aplicación. Finalmente, se presenta una propuesta para transformar de forma transparente aplicaciones MPI en trabajos maleables. Esto es, programas paralelos que en tiempo de ejecución son capaces de adaptarse al número de procesadores disponibles en el sistema, consiguiendo beneficios, como mayor productividad, mejor tiempo de respuesta y mayor resistencia a fallos en los nodos. Todas las soluciones propuestas han sido implementadas a nivel de aplicación, siendo independientes de la arquitectura hardware, el sistema operativo, la implementación MPI usada y de cualquier framework de alto nivel, como los utilizados para el envío de trabajos.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno