我们的服务器不断崩溃,出现死机紫屏。我尝试解释崩溃转储,但无济于事。我有一台运行 ESXi 6.0 的 HP Proliant DL360 G7,我还有其他运行相同软件的相同服务器,都没有问题,但这台服务器每周都会崩溃一次,并出现以下错误。
机器检查异常:世界 32801:coalesceWorl 中的 PCPU5 上发生致命(不可恢复)MCE 系统遇到硬件错误 - 请联系硬件供应商
如果有人愿意查看并帮助我找出问题的具体原因,我有所有的崩溃转储日志。当这台服务器一直崩溃时,我无法将其投入生产。
您可以在此处查看最新的崩溃转储。http://pastebin.com/JvziBPtA
如有任何帮助我将不胜感激。
答案1
我建议进行故障排除或按照错误消息的指导进行操作。
您可以做的事情:
- 您正在运行 2016 年 3 月的 ESXi 版本 #3620759。更新您的 ESXi 安装!!
- HP 服务器具有全面的诊断信息和日志记录。
- 查看 ILO3 界面并打开 HP IML 日志。这将告诉您哪里出了问题。
- 如果您正在使用 HP 特定的 ESXi 安装,请查看您的硬件状态界面。
- 从运行诊断程序惠普 ProLiant 服务包可启动 DVD。
- 致电 HP 支持。