我实际上正尝试报告 Slurm 中的集群利用率,但我不明白该指标CPU 分钟数。
[root@XXXX]# sreport cluster Utilization Start=2018-12-01 End=2018-12-31
--------------------------------------------------------------------------------
Cluster Utilization 2018-12-01T00:00:00 - 2018-12-30T23:59:59
Usage reported in CPU Minutes
--------------------------------------------------------------------------------
Cluster Allocate Down PLND Dow Idle Reserved Reported
--------- -------- -------- -------- --------- -------- ---------
linux 744460 0 0 8187049 54091 8985600
我是否应该将该值除以线程数/CPU 数?
谢谢。
答案1
的手册页sreport
解释了不同的列,并且默认格式(-t
)是“分钟”。
集群利用率
此报告将显示所选集群的总使用量除以已分配、停机、空闲和预留时间。预留时间是指作业符合条件后等待资源的时间。如果该值对您来说并不重要,则应将该数字与空闲时间分组。
您的报告期为 30 天,有(30*24*60)43200 分钟(12 月有 31 天/44640 分钟,但End=<OPT>
默认为前一天结束)。8985600 除以 43200 等于 208。这与您的 CPU 或线程总数相对应吗?