IPMI:机箱和 BMC 自检失败,如何修复?

IPMI:机箱和 BMC 自检失败,如何修复?

我有一个 Intel Linux 集群,节点上有 IPMI 接口。最近,IPMI 接口表现不稳定。例如,我无法再使用 IPMI 命令让节点进行 PXE 启动,通过 IPMI 重新启动它们有时有效,但并非总是有效。

我最近发现可以使用 ipmitool 测试底盘和 BMC,输出如下:

# ipmitool chassis selftest
Self Test Results    : device error
                       [FRU Internal Use Area corrupted]

# ipmitool bmc selftest
Selftest: device corrupted
Internal Use Area corrupted

看起来好像出了点问题。有什么方法可以将 IPMI 接口恢复到其原始状态?(请注意,我不知道这里的具体 IPMI 硬件是什么,也不知道如何查询它们来找出答案)。

答案1

重新刷新固件/BIOS 可能会有帮助...或者对机器进行硬电源循环 - 完全拔掉电源插头。

它们是什么类型的机器?

答案2

我将首先尝试在同一类型的其他机器上验证这一点 - 很可能所有同一类型的系统都存在某种 ipmi 异常,而 ipmitool 无法正确处理。

答案3

跑步ipmitool reset warm或者ipmitool reset cold有时候也能有帮助。

相关内容