La Red de Conocimientos Pedagógicos - Currículum vitae - Slurm Ver trabajos históricos

Slurm Ver trabajos históricos

Comencé a usar Slurm y supuse que el lote de script de envío que pasé se estaba ejecutando en el controlador y que el paso etiquetado srun se ejecutaría como un paso de trabajo en los nodos de cálculo. Considere el siguiente ejemplo:

#!/bin/bash

#SBATCH - CPU por tarea 12 # s Batch-gres = GPU:1 # s Batch-job-name = hola

nombre de host

srun nombre de host

Me gustaría ver primero el nombre de host de la máquina a la que envié, luego el nombre del nodo de cálculo asignado al trabajo. . En cambio, parece que todo el script se está ejecutando en el nodo de cálculo. Vi el nombre de host del nodo de cálculo en los registros y luego falló porque srun en el nodo no pudo encontrarlo: