Sun Grid Engine:自动终止空闲交互作业

Sun Grid Engine:自动终止空闲交互作业

我们正在考虑使用太阳网格引擎在小型计算集群上。目前,当前的设置非常粗糙,只是让人们通过 ssh 连接到开放的机器来运行他们的工作。

我们希望允许交互式作业,因为这应该可以简化从手动启动作业到使用 启动作业的过渡qsub。但是,有人担心,如果我们这样做,人们可能会意外地让他们的交互式会话处于空闲状态,并阻止其他作业在机器上运行。这个问题不仅仅是理论上的,因为我们以前尝试过使用 OpenPBS,并且存在一个问题,即人们在屏幕会话中打开交互式作业并基本上驻扎在机器上。

有没有办法配置 SGE 自动终止空闲的交互式作业?这似乎是作为增强功能而提出的要求(问题编号:2447) 早在 2007 年就已提出这一要求。但这一请求似乎并未得到实施。

答案1

您可以设置 SGE 具有合理的默认挂钟时间 (h_rt),以在预定义的限制后终止会话。

您是否尝试过让用户的 shell 在空闲时超时?更多信息和示例请访问http://www.cyberciti.biz/faq/linux-unix-login-bash-shell-force-time-outs/

答案2

nayrmil 提出了一些很好的建议。另一个选择是限制哪些机器可以运行交互式作业。我们基本上将一些节点指定为“交互式”,并在它们上放置一个队列,以超额订阅节点资源,这样许多用户可以同时登录。用户基本上可以在那里停留任意长的时间,但如果他们想要访问一些真正的资源,他们需要提交适当的作业。

相关内容