HP DL360 G7 上无法纠正的机器检查异常

HP DL360 G7 上无法纠正的机器检查异常

我每小时都会在 IML(hplog)中从 HP DL360 G7 记录一次:


CRITICAL: CPU - Uncorrectable Machine Check Exception (Board 0, Processor 1, APIC ID 0x00000003, Bank 0x00000005, Status 0xBE000000'00800400, Address 0x00003FFF'811239E0, Misc 0x00000000'00007FFF)

hpasmcli> show server
System        : ProLiant DL360 G7   
ROM version   : P68 09/30/2010
iLo present   : Yes

有人能告诉我上面的 IML 状态代码引用了哪个部分吗?

预先感谢!

答案1

请将服务器上的 BIOS 升级到当前版本。如果此问题在如此定期的间隔内可重现,那绝对是我会尝试的第一件事。

运行此更新的最安全方法是使用离线HP ProLiant DVD 服务包图片。如果没有,您能告诉我们您使用的是哪种操作系统吗?您可以下载特定于您服务器的更新从这里

除此之外,这可能是系统板问题。您可以尝试移动/重新安装 DIMM,看看错误消息是否发生变化(跟随 DIMM)。如果没有,则可能是处理器 1 的 CPU 插槽。检查 LGA 插槽是否有弯曲的针脚。

您也可以致电 HP ProLiant 支持...

答案2

这里让更多人遇到类似的问题。

可能的解决方法:在 BIOS 中,将电源调节器模式更改为“静态高性能”

2011 年 5 月 5 日的 BIOS 更新可能会带来解决方案:

解决了可能导致以下任一情况的问题:操作系统停止响应、系统意外重置、使用 Microsoft Windows 操作系统时出现蓝屏、使用 Linux 操作系统时出现内核崩溃或使用 VMware ESX 时出现紫屏。当出现此问题时,操作系统可能会显示一条消息或 HP 集成管理日志 (IML) 中记录一条消息,表示“无法纠正的机器检查异常”。但是,在某些情况下,系统会在操作系统显示错误消息之前重置,并且在某些情况下,当出现此问题时,IML 不包含任何日志条目。如果将最低处理器空闲状态配置为无 C 状态或 C1E 状态,则不会出现此问题。

相关内容