在两台计算机上共享的小任务队列

在两台计算机上共享的小任务队列

有两台计算机,每台计算机有 12 个物理核心。

计算机 A 应该接受作业并将其分配给 A 和 B

我想对计算机 A 和 B 进行设置

  • A 将接受作业(通过 ssh)并将其分配给 A 和 B(或多或少智能地)
  • 如果可能的话,我想根据“个人需求”阻止每台计算机上的 4 个核心

作业应该是 python 脚本或用 C++ 编写的可执行文件(可以涉及 mpi 代码)。

我读过 slurm 和 Sun Grid Engine,但这对于这个用例来说似乎有点太强大/复杂了(我不想花一周的时间阅读如何做到这一点和故障排除)。有没有更简单的方案可以满足要求呢?

相关内容