有哪些方法可以防止用户在 Rocks 集群的头节点上启动长时间运行、资源密集型的进程?
我试过了:
- 礼貌地询问
- 将 limits.conf 中的优先级设置为 19。没有达到预期的效果。进程在 19 优先级下运行,但机器仍然无响应(可能是内存)
我正在考虑:
- 在 limits.conf 中设置时间/内存限制
- 破坏了 /bin/python 等流行程序的链接。看起来很笨拙
其他想法:
- 禁止违规用户不是一种选择
- 有时用户需要运行交互式会话。这可以通过使用 qrsh 通过控制台启动一个会话来完成,因此实际上不需要在头节点上运行任何操作
答案1
我们禁止登录到我们的头节点,并在用户工作站上安装了 gridengine 客户端实用程序。用户可以qrsh
从他们的工作站运行以在集群上进行交互式会话,并且仍可使用qsub
和qstat
。