Ayuda
Ir al contenido

Dialnet


Resumen de Un planificador de GPUs remotas para clusters HPC

Sergio Iserte, Adrián Castelló, Carlos Reaño, Antonio J. Peña, Federico Silla Jiménez, Rafael Mayo, Enrique Salvador Quintana Ortí, José Duato

  • SLURM es un planificador de recursosque permite gestionar un cluster heterogéneo, compartiendoalgunos de los recursos del cluster entrelos procesos que los solicitan para su ejecución. Sinembargo SLURM no está capacitado para compartirciertos recursos genéricos, como las GPUs, entre losnodos, como lo hace con las CPUs, ya que el planificadorgestiona el uso de GPUs pero sólo pueden serutilizadas por el nodo en el que se encuentran físicamenteinstaladas. Esta característica de SLURM seconvierte en una limitación cuando se emplean solucionesde virtualización de GPUs como rCUDA, cuyopropósito es proporcionar acceso transparente a lasGPUs de un cluster aunque ´estas estén instaladasen otro nodo. Para hacer compatible la planificaciónde SLURM con el funcionamiento de rCUDA, se hacreado un nuevo recurso compartido, la rgpu y se haañadido al código de SLURM la lógica necesaria paraque acepte este nuevo recurso y sea capaz de tratarlocomo los recursos no genéricos.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus