当我在头节点上运行多个作业时,我喜欢使用命令来监视进度top
。
但是,当我使用 PBS 在集群上运行多个作业时,top
当然不会显示这些作业,并且我不得不使用“qstat”。但是,需要重复运行该qstat
命令才能继续监视作业。top
实时更新,这意味着我可以在侧面打开终端窗口,并在做其他工作时偶尔看一眼。
有没有办法实时监控(就像命令top
所做的那样)我使用 PBS 命令提交的集群上的作业qsub
?
在谷歌上进行了大量搜索后,我很惊讶看到这么少。
答案1
为什么不定期watch
更新 qstat 呢?
watch --interval=0.5 qstat
将每 0.5 秒刷新一次带有 qstat 输出的终端。它不太满足你不qstat
重复运行的要求,但它根本不是手动的。
答案2
如果你想成为超级老板,你可以随时使用“pbstop”
它基本上是本地进程“htop”的 PBS 集群版本。
(请注意,您的集群可能没有安装此软件。请向管理员询问!)
(此外,支持按用户、队列等进行交互式过滤)
例如: