Slurm Ver trabajos históricos
Comencé a usar Slurm y supuse que el lote de script de envío que pasé se estaba ejecutando en el controlador y que el paso etiquetado srun se ejecutaría como un paso de trabajo en los nodos de cálculo. Considere el siguiente ejemplo:
#!/bin/bash
#SBATCH - CPU por tarea 12 # s Batch-gres = GPU:1 # s Batch-job-name = hola
nombre de host
srun nombre de host
Me gustaría ver primero el nombre de host de la máquina a la que envié, luego el nombre del nodo de cálculo asignado al trabajo. . En cambio, parece que todo el script se está ejecutando en el nodo de cálculo. Vi el nombre de host del nodo de cálculo en los registros y luego falló porque srun en el nodo no pudo encontrarlo: