Qsub 到具有超过 n 个可用核心的任何节点

Question 1

要使 Gridengine 在单个节点上安排 20 个核心作业，您必须创建一个新的并行环境或调整您正在使用的环境。您需要的设置是

allocation_rule    $pe_slots

从man sge_pe：

如果使用特殊分母 $pe_slots，则必须在单个主机上分配使用 qsub(1) -pe 开关指定的全部进程。

不要忘记将新的 PE 添加到您的队列中。

要解决您的原始问题，在多个节点上运行 MPI 作业，您可以提出第二个问题，其中包含更多详细信息。

Answer

要使 Gridengine 在单个节点上安排 20 个核心作业，您必须创建一个新的并行环境或调整您正在使用的环境。您需要的设置是

allocation_rule    $pe_slots

从man sge_pe：

如果使用特殊分母 $pe_slots，则必须在单个主机上分配使用 qsub(1) -pe 开关指定的全部进程。

不要忘记将新的 PE 添加到您的队列中。

要解决您的原始问题，在多个节点上运行 MPI 作业，您可以提出第二个问题，其中包含更多详细信息。

Question 2

如果您使用-pe smp 20而不是，-pe mpi 20您将使用 SMP（“共享内存并行性”）环境而不是 MPI。

SMP 是一种更简单的并行方法在一台计算机上运行，跨线程共享本地系统内存。因此，它将所有请求的槽放置在单个节点上（如果可用），而不是将它们拆分到多个计算节点上。

对我来说，这似乎已经解决了问题。

Answer

如果您使用-pe smp 20而不是，-pe mpi 20您将使用 SMP（“共享内存并行性”）环境而不是 MPI。

SMP 是一种更简单的并行方法在一台计算机上运行，跨线程共享本地系统内存。因此，它将所有请求的槽放置在单个节点上（如果可用），而不是将它们拆分到多个计算节点上。

对我来说，这似乎已经解决了问题。

相关内容