在 SLURM 中设置交互式会话

在 SLURM 中设置交互式会话

我有一个带有 256 (128x2) 个核心的工作站,我使用 SLURM 调度程序在其中提交作业。我还尝试使用 srun/salloc 设置一个交互式会话,其中为此保留两个核心,但这两个似乎都无法正常工作。当它们工作时,它们会尝试使用两个套接字,如果我正在运行其他作业,它们将无法正确提交。当这个交互式会话使用这些命令运行时,我也无法提交任何作业,即使应该有 254 个可用核心。有人遇到过类似的问题或知道如何解决这个问题吗?谢谢!

编辑:我们正在使用内核 6.2.0-26-generic 和 ubuntu 22.04.4 LTS

相关内容