使用 Slurm 工作负载管理器,我如何防止用户bob
启动更多作业?现有作业应继续运行。用户应该能够提交更多作业,但不能启动。
答案1
Slurm 的sacctmgr
命令可用于修改每个用户的各种限制。您需要成为相关帐户的帐户协调员或 root。将其中任何一个设置为0
应该可以解决问题:
MaxJobs
GrpJobs
举个例子:
$ sacctmgr modify user where name=bob set MaxJobs=0
几分钟后,如果您运行squeue
用户,您应该会看到类似这样的内容:
$ squeue -u bob -o "%i %r"
JOBID REASON
20582420 AssocMaxJobsLimit
20583282 Dependency
请注意,原因Dependency
似乎优先于用户限制,但它无论如何都不会运行,因为它正在等待其他作业运行。同样,JobArrayTaskLimit
将优先于用户限制,但作业不会启动。
要删除限制,请将值设置为-1
:
$ sacctmgr modify user where name=bob set MaxJobs=-1
您可以使用以下命令显示用户的现有限制:
$ sacctmgr list assoc User=bob