Sistema de gestión de trabajos LSF
LSF (Load Sharing Facility) es un sistema de gestión de trabajos ampliamente utilizado con las ventajas de un alto rendimiento y una configuración flexible. A través del monitoreo y la programación centralizados de LSF, la CPU, la memoria, el disco y otros recursos de la computadora se pueden utilizar por completo.
Hay tres formas de enviar un trabajo usando bsub:
Puedes ingresar directamente los parámetros completos en la línea de comando de bsub para enviar el trabajo, por ejemplo:
Uso Los parámetros se describen a continuación:
Este método es más adecuado para enviar trabajos simples. El control de trabajos más complejos requiere escribir scripts de trabajos.
El script de trabajo LSF es esencialmente un script de shell, en el que los parámetros del trabajo bsub se pueden representar mediante líneas que comienzan con #BSUB. El siguiente es un ejemplo de un script de trabajo LSF:
Los parámetros se describen a continuación:
Utilice el siguiente comando para enviar el script de trabajo:
Intro bsub en la terminal y presione Enter para ingresar al entorno de interacción de bsub, puede ingresar los parámetros del trabajo y ejecutar el programa de trabajo. En el entorno interactivo de bsub, puede enviar varios trabajos con los mismos parámetros a la vez, por ejemplo:
Utilice Ctrl+D para salir del entorno interactivo de bsub.
Puede utilizar el comando bjobs para ver los trabajos que está ejecutando un usuario:
Utilice el parámetro -l del trabajo y JOBID para ver los detalles del trabajo:
Usar el comando bkill Aborta el trabajo:
El sistema de gestión de trabajos LSF se presentó brevemente anteriormente. Presentaremos el sistema de gestión de recursos SLURM en el próximo artículo.