NVML(nvidia-smi) 不支持该显卡的温度
nvidia-settings 不起作用,因为它是一个集群节点(有 3 个 GPU)并且没有 X
lm-传感器不显示 GPU
Ipmitool 应该做到这一点(在谷歌中找到示例),但对我来说它显示
Temp 16 (GPU2) | 1Fh | ns | 11.3 | Disabled
Temp 17 (GPU3) | 20h | ns | 11.4 | Disabled
Temp 18 (GPU1) | 21h | ns | 11.5 | Disabled
有没有其他命令行工具或库可以做到这一点?
预先感谢您的任何建议
驱动程序版本:304.43
答案1
您是否尝试过查看 nvidia-debugdump --help' 命令,我是 Tesla 的大用户,但在 Windows 上而不是 Linux 上,抱歉,所以没有真正的方法来测试它,但我有一种感觉可能会有所帮助。