对于此 bash 脚本,我收到此错误“sbatch:错误:批处理作业提交失败:指定的节点名称无效”
#!/bin/bash -l
#SBATCH --gpus=1
#SBATCH -p overcap
#SBATCH -A overcap
#SBATCH --signal=USR1@120
#SBATCH --time=10:00
#SBATCH --requeue
#SBATCH --nodelist=brainiac,omgwth,cyborg,sonny,robby,spd-13,qt-1,dave,nestor,crushinator,deebot,xaea-12,baymax,megabot,randotron,chappie,heistotron,roberto,herbie,shakey,chitti,samantha,clippy,kitt,tachikoma
#SBATCH -o err_test.out
srun python src/train.py
有没有办法找出列表中哪个节点无效?
答案1
您可以使用sinfo
或sinfo -N
获取 slurm 配置的有效节点名称列表。然后与脚本中的内容进行比较。