如何获取有关特定 SGE 队列中待处理作业的统计信息(例如使用 qacct)?

如何获取有关特定 SGE 队列中待处理作业的统计信息(例如使用 qacct)?

我知道我可以用来qacct获取有关正在运行的作业的各种统计数据。现在有没有办法获取有关有多少作业处于待处理状态以及它们平均需要等待多长时间的统计数据?

附加问题:我可以获得有关 SGE 中“闲置”(或空置)时段的统计数据吗?

答案1

qacct 主要获取已完成作业的信息,而不是正在运行的作业的信息。如果您MONITOR=1在 sched_conf 参数中设置,调度程序将把有关预留的信息记录到调度文件中。您可以使用它来找出这些特定作业仍需等待多长时间。

或者,会计文件记录历史作业开始和提交时间(对于已完成的作业)。

如果您想要了解排队的作业数量,那么您可以尝试使用 cronjob 对输出进行采样qstat -s p -u '*'

相关内容