添加 virtual_free 后 Sun Grid Engine (SGE) 作业不可见

添加 virtual_free 后 Sun Grid Engine (SGE) 作业不可见

我正在尝试使用 virtual_free 来限制集群中每个网格节点运行的大内存作业的数量。这似乎按预期工作。

在我修改代码以使用内存实例提交作业后,qstat -f -q $queueName 不再显示等待插槽的作业列表。

作业通过特定队列 (-q $queueName) 提交。

我猜这是由于 SGE 队列选择的魔力造成的。有没有办法让我的工作像以前一样显示出来?

谢谢!

更新

我在用着:

qstat -f -u * -q $队列名称

查看队列。如果我删除队列参数,我可以看到作业。如果我检查特定作业,我可以看到它已设置正确的 hard_queue_list 值。

我也在使用 Sun Grid Engine 6.1u4

答案1

这些工作是请求队列。他们实际上并不是队列直到它们开始在具有该队列实例的主机上运行。只有当它们实际开始在请求的队列中运行时,您才会在队列特定的输出中看到它们。如果您考虑到您可以在队列请求中使用通配符,那么这完全有意义。

答案2

如果它们没有出现,qstat则表示它们尚未提交或已崩溃,提交后,SGE 队列选择魔法就会启动。还请检查 qstat 是否报告了提交该作业的用户!

如果有未满足约束的作业,那么 SGE 将简单地排队,直到它们可用。

相关内容