我使用 Open Grid Scheduler(Sun Grid Engine 的一个分支/副本)。
我已经尝试过此配置掌握:
# qconf -mattr exechost complex_values slots=8 slave2
# qconf -mq all.q | grep slots
slots 100,[slave1=1],[slave2=8]
从属1挂了,然后我运行 10qsub
带有睡眠示例的作业(因此没有 CPU 消耗),但只有 4 个作业同时运行从属2而不是我已经放了 8 个插槽。
我错过了什么?
附言:我的目标是提供无限的插槽,以强制 SGE 仅通过可消耗资源进行调度。
答案1
我会尝试运行qalter -w p
其中一个排队作业,看看它为什么无法启动。还要检查队列的状态,确保它们没有处于警报状态。