我有一个 Intel Linux 集群,节点上有 IPMI 接口。最近,IPMI 接口表现不稳定。例如,我无法再使用 IPMI 命令让节点进行 PXE 启动,通过 IPMI 重新启动它们有时有效,但并非总是有效。
我最近发现可以使用 ipmitool 测试底盘和 BMC,输出如下:
# ipmitool chassis selftest
Self Test Results : device error
[FRU Internal Use Area corrupted]
# ipmitool bmc selftest
Selftest: device corrupted
Internal Use Area corrupted
看起来好像出了点问题。有什么方法可以将 IPMI 接口恢复到其原始状态?(请注意,我不知道这里的具体 IPMI 硬件是什么,也不知道如何查询它们来找出答案)。
答案1
重新刷新固件/BIOS 可能会有帮助...或者对机器进行硬电源循环 - 完全拔掉电源插头。
它们是什么类型的机器?
答案2
我将首先尝试在同一类型的其他机器上验证这一点 - 很可能所有同一类型的系统都存在某种 ipmi 异常,而 ipmitool 无法正确处理。
答案3
跑步ipmitool reset warm
或者ipmitool reset cold
有时候也能有帮助。