在我自己的 bash 管道中创建一个 -resume 选项

在我自己的 bash 管道中创建一个 -resume 选项

我正在做一个 bash 管道,它提交具有依赖关系的不同 SLURM 作业(如所解释的这里或以下)。如果一项作业崩溃,则必须重做之前的所有作业才能成功完成一次失败的作业。如何创建一个“恢复”选项,使其直接返回到失败的作业?

job1=$(sbatch ...) # no dependency 
job2=$(sbatch --dependency=afterany:$job1 ...) # dependent on job1 success - PD meanwhile
job3=$(sbatch --dependency=afterany:$job2 ...) # dependent on job2 success - PD meanwhile

否则,scontrol 或类似的东西是否足以返回失败的作业?

相关内容