GNU Queue - 替代方案

GNU Queue - 替代方案

我尝试构建基于 CentOS 的网格集群。所有机器的结构都有些相似(有些机器的处理器多于其他机器),我只需要将作业推送到队列,然后在可用节点上运行。每个 CPU 一个作业,其余作业保持排队等待。

John T 非常有帮助指引我Gnu 队列这似乎对我所假装的很有帮助(这些工作本质上是洗澡脚本)。在接受他的回答之前,我仍在研究这个问题,但我请求社区提供一些反馈,因为 Gnu Queue 网站似乎表明该项目已经死了好几年了。

我也看过了太阳网格引擎它也看起来像是这个职位的候选人,不幸的是,Oracle 现在正在终止这个项目,尤尼瓦尚未发布其端口。

我只想从右脚开始,所以我的问题是,您是否有过这种集群(网格计算)的实际经验?您的建议是什么?

先感谢您。

答案1

如果你不需要真正的排队系统,GNU并行足以同时在每个系统上启动作业。如果你确实需要一个真正的调度程序,那么TORQUE 资源管理器以及可选的调度程序,例如茂宜岛可能需要。

你也可以放弃 CentOS,转而使用 Live CD,例如PelicanHPC至少,配置会更简单(至少就其功能而言)。假设您在某所大学,那里根本没有人做 HPC 和/或集群?而且没有与国家实验室或类似机构有联系的教员可以为您的项目提供 CPU 时间?

而这个问题或许可以作为迁移到 Serverfault 的候选。

答案2

我们用秃鹰用于作业排队等

相关内容