有两台计算机,每台计算机有 12 个物理核心。
计算机 A 应该接受作业并将其分配给 A 和 B
我想对计算机 A 和 B 进行设置
- A 将接受作业(通过 ssh)并将其分配给 A 和 B(或多或少智能地)
- 如果可能的话,我想根据“个人需求”阻止每台计算机上的 4 个核心
作业应该是 python 脚本或用 C++ 编写的可执行文件(可以涉及 mpi 代码)。
我读过 slurm 和 Sun Grid Engine,但这对于这个用例来说似乎有点太强大/复杂了(我不想花一周的时间阅读如何做到这一点和故障排除)。有没有更简单的方案可以满足要求呢?