SLURM es un planificador de recursosque permite gestionar un cluster heterogéneo, compartiendoalgunos de los recursos del cluster entrelos procesos que los solicitan para su ejecución. Sinembargo SLURM no está capacitado para compartirciertos recursos genéricos, como las GPUs, entre losnodos, como lo hace con las CPUs, ya que el planificadorgestiona el uso de GPUs pero sólo pueden serutilizadas por el nodo en el que se encuentran físicamenteinstaladas. Esta característica de SLURM seconvierte en una limitación cuando se emplean solucionesde virtualización de GPUs como rCUDA, cuyopropósito es proporcionar acceso transparente a lasGPUs de un cluster aunque ´estas estén instaladasen otro nodo. Para hacer compatible la planificaciónde SLURM con el funcionamiento de rCUDA, se hacreado un nuevo recurso compartido, la rgpu y se haañadido al código de SLURM la lógica necesaria paraque acepte este nuevo recurso y sea capaz de tratarlocomo los recursos no genéricos.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados