我的一台 DL165 G7 Proliants 本月第二次意外重启。重启时 LightsOut 中出现了以下系统事件日志条目:
Event Type Date Time Source Description Direction
OEM -- -- -- 00 00 00 00 01 02 00 00 00 00 00 00 00 --
Generic 07/19/2013 16:40:38 NMI Detect State Asserted Assertion
Generic 07/19/2013 16:40:42 Gen ID 0x41 Run-time Stop Assertion
OEM 07/19/2013 16:40:42 000137 01 80 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 02 54 44 4f 00 01 --
OEM 07/19/2013 16:40:42 000137 02 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 03 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 03 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 04 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 04 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 05 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 05 00 00 00 00 01 --
Generic 07/19/2013 16:43:54 Gen ID 0x41 C: boot completed Assertion
OEM 07/19/2013 16:43:54 000137 00 b4 6c e9 51 00 --
我已联系 HP 支持部门寻求帮助来解码事件,但不幸的是,没有任何显著的成功 - 我被告知没有可用的可访问文档。它试图告诉我什么,我如何找出这里出了什么问题?
编辑:系统正在运行 Hyper-V 2012。与重置有关的唯一有用事件是 Kernel-Power/41,其 BugcheckCode 为 128 / 0x00000080,BugcheckParameter1 为 0x4f4454,与 iLO 事件日志的前两个 OEM 行匹配(至少在您以小端方式交换字节之后)。错误检查代码让我这篇 MSDN 文章这直白地表明“具体原因很难确定”。
在 HP 支持中心,我可以找到看似相似的问题描述解决方案是同步集群节点之间的时钟。虽然我的故障主机确实在集群中运行,但我已经同步了时钟,当时钟出现偏差时,我无法重现该问题(撇开明显的 Kerberos 身份验证问题不谈,如果我取消时钟同步,也不会发生什么大事)。
到目前为止,我能够收集到有关此问题的奇怪信息:
- IPMI 事件日志中的运行时停止条目指示操作系统蓝屏(Winbond/Nuvoton WPCM450 BMC 用户指南第 2.5.2 章)
- 这OpenIPMI 项目的 IPMI 文档手册页指出您无法使用标准接口发送 OEM 事件
- 非传染性疾病过去似乎很常见发出ECC奇偶校验错误信号并启动PC的重置,但这些信息似乎已经过时了,并且在这两种情况下我都希望有适当的事件日志条目告诉我发生了错误或重置 - 但我没有。
- 根据bmc-device 手册页和这篇文章来自 vger Linux 内核邮件列表,生成器 ID 0x41 似乎意味着 NMI 是由本地管理或内核触发的。
答案1
我在使用 HP ProLiant G380 G6 和 Windows 2008 R2 时也遇到了类似的问题,在支持和帮助论坛中搜索了很多次也无济于事,最终我使用 HP Smart Update Manager DVD 在服务器上安装了所有最新更新,一年半过去了,到目前为止没有出现任何错误。
这可能是一个长远的目标,但请尝试使用最新的更新,这是最新的 HP SUM DVD
如果你尝试在 2012 服务器上运行它,你可能会收到一个错误,提示它不兼容,根据 HP 这是正常的您只需忽略错误。
希望这可以帮助。