我对 Torque 和 Maui 还很陌生。
我正在检查节点状态以查找哪些节点是空闲的以及哪些节点正在使用中。
对于扭矩,一个命令是pbsnodes
。它提供与节点相关的状态和其他信息。
当我检查 maui 时,我发现命令diagnose -n
也显示了节点的状态。
我对这两种状态感到疑惑。对于相同的情况,这两种状态都给出了不同的状态。
当我这样做时,man pbsnodes
我得到了节点的可能状态,"free", "offline", "down", "reserve", "job-exclusive", "job-sharing", "busy", "time-shared", or "state-unknown"
但是我找不到这种不同的状态diagnose -n
。
如何pbsnodes
获取diagnose -n
节点的状态。是否有任何类似 xCAT 的数据库用于 Torque 或 Maui?
提前感谢您的宝贵时间。
答案1
虽然 Torque 和 Maui 相关,但它们确实维护有关它们管理的计算节点的单独信息。
Torque 是集群的资源管理器:它跟踪计算节点列表、每个节点的硬件等。Torque 内置有自己的简单作业调度程序,但通常会关闭它以支持其他调度程序。Maui 位于 Torque 的“顶部”,并在其节点上调度作业。它比内置的 Torque 调度程序支持更灵活的调度,并且必须跟踪与 Torque 不同的信息 - 因此它报告的状态可能不同。
我不太了解 xCAT,但它们都没有所谓的数据库。Torque 在文本文件中有一个节点列表,server_priv/nodes
而 Maui 只使用 Torque 提供的任何节点。