我们正在用 SGE/OGE 替换自建的排队系统。当前工作环境中的工程师使用自己的本地 Linux 工作站提交作业。因此,我想知道是否可以将许多机器作为提交主机添加到 SGE/OGE 集群。在我们的案例中,可能有大约 100-200 个提交主机向具有大约 30-50 个执行节点的集群提交作业。
我认为这与“正常”情况相反,正常情况下只有一台(或者可能只有几台)提交主机作为集群的前端。拥有大量提交主机有什么缺点吗(除了必须通过 qconf 添加它们)?
答案1
除了跟踪哪些主机是提交主机之外,我还没有发现其他缺点。据我所知,GridEngine 只会在提交时检查列表,而不会从服务器发起任何到提交主机的连接。
在我们的环境中,所有工作站、执行主机和许多其他机器都设置为提交主机,到目前为止,我还没有看到任何有害影响。总数约为 120。
我们允许用户工作站提交作业,同时为 VPN 用户提供可以通过 SSH 访问的网关机器。