我的一台服务器(DELL PowerEdge 2850)出现了问题。它意外重启,在事件日志中抛出事件 ID 6008(“意外关机”)。这个问题从昨天开始,昨天已经重启了大约 10 次,今天仍然如此。
在 6008 事件发生之前,事件日志中没有记录任何其他事件或错误。我们没有对硬件进行任何更改。我们在“软件”方面所做的唯一更改是启用了我们开发的 .NET 服务,该服务在相同的服务器上运行,并且已经运行了 2 年,没有任何问题。除此之外,软件保持不变。我已将其设置为在服务器发生故障时执行内核内存转储,但它甚至没有这样做。我为此致电技术支持,但我们仍然没有解决方案。我重新安装了电源,切换了服务器电源所在的 PDU,并运行了完整的 DELL 诊断测试(不是快速测试),所有测试都通过了。我向技术支持人员建议可能是电源的问题,但他们说不是,因为它有两个电源,其中一个用作备用电源,所以不可能是电源的问题。
其他注意事项:服务器不在 USP 上 - 这并不理想,但这就是设置。我的房间中还有另外两台服务器与它一起运行,没有一台遇到与这台服务器相同的问题。
有人遇到过类似的问题吗?任何见解或建议都将不胜感激!
谢谢!
答案1
撤销您最后所做的操作(打开您的 .NET 服务),无论它过去如何运行或如何在另一台服务器上运行。
答案2
可能是很多原因导致它重新启动。由于您说您启用了内核转储,但并没有得到内核转储,这意味着要么系统电源被立即切断,没有给它机会,要么内核认为将转储写入磁盘不安全。无论哪种情况,这听起来都与硬件有关。
您可能需要关闭它并重新安装 RAM,如果硬盘是热插拔的,只需将它们也推入即可。这是在做无用功,但你永远不知道会发生什么。
查看事件日志,关机前发生了什么事件——在电源关闭前立即发生任何不寻常或奇怪的一致事件?系统日志可能会最有帮助,但是应用日志有时会显示一些有趣的东西。
我对戴尔服务器不太熟悉,但如果它们与惠普服务器类似,它们会配备某种 iLO,可能会提示硬件故障。我遇到过类似的事情 - Windows 报告意外关机,但惠普集成日志报告硬盘在重启前立即坏了,我只能假设 RAID 控制器出现了抖动,Windows 对此不满意并崩溃了。