在集群中,一个作业被提交到 N 个 CPU 上运行。除了时间之外,qstat -f 不会显示该作业使用了多少 CPU 资源。如何检查每个 CPU 功率是否被 100% 使用?这对于确定任务所需的资源至关重要。
答案1
本文档给出了解决方案,使用 pdsh 查看节点上“top”的输出,或者如果作业在多个节点上运行,则使用“all”命令。
pdsh -j 123456 top -b -n 1 -u usr1234
在集群中,一个作业被提交到 N 个 CPU 上运行。除了时间之外,qstat -f 不会显示该作业使用了多少 CPU 资源。如何检查每个 CPU 功率是否被 100% 使用?这对于确定任务所需的资源至关重要。
本文档给出了解决方案,使用 pdsh 查看节点上“top”的输出,或者如果作业在多个节点上运行,则使用“all”命令。
pdsh -j 123456 top -b -n 1 -u usr1234