PBS/Torque 中的非独占作业调度

PBS/Torque 中的非独占作业调度

集群资源管理器 Torque 通常以独占方式分配计算节点。但是,当您有大量小型作业(如我们)在多核计算节点上运行时,这可能会导致大量资源浪费。有没有办法配置 Torque 以允许非独占地分配计算节点上的核心?

(这些作业都是高度并行的,因此我们不必担心共享网络资源的争用。我们无法切换调度程序,因为我们客户的作业脚本都在 PBS/Torque 中。)

答案1

好的,这实际上是 Maui 的问题。我在这里给出答案,这样其他人就不必浪费一天的时间了。:)

首先:让您的 Torquenodes文件列出带有 np 参数的节点,即nodename np=8。这将确保资源管理器知道正确的处理器数量。

其次,对于 Maui:确保您的 maui.cfg 文件包含该行NODEACCESSPOLICY SHARED。然后非独占调度应该可以工作。

相关内容