适用于 Debian/ubuntu 的网格引擎/集群管理和作业调度程序

适用于 Debian/ubuntu 的网格引擎/集群管理和作业调度程序

我需要在类似于集群的东西上执行大量计算,硬件和操作系统是相同的(操作系统是ubuntu),但没有安装中央管理软件或网格引擎。网络搜索结果大多是过时的或专有的软件。

我希望我的问题不是太笼统,但是,Debian 及其衍生版本的集群管理和作业调度选项是什么?

对于集群的一般管理,我使用 cssh,但这种方法在作业调度和监控方面不是很有效。我有使用历史悠久的 Sun 网格引擎 RIP 的经验。

感谢您阅读本文!

答案1

如果您谈论的是 Debian/Ubuntu 存储库中当前可用的内容,我至少知道两个选项。

  • SGE 有一个活跃的免费分叉,网格引擎之子。当前 Debian/Ubuntu 中的软件包基于此分支。请参阅gridengine-mastergridengine-exec包。

  • 斯鲁姆。查看slurm-wlm包装。

相关内容