服务器每 14 天崩溃一次,没有错误检查

服务器每 14 天崩溃一次,没有错误检查

每 14 天,我们的一台 Windows 服务器就会崩溃。我们一直在努力找出原因,但无济于事。

今天,我们注意到服务器关闭有一个规律,每 14 天发生一次,并且在更改崩溃时间之前大约在同一时间发生 4 次崩溃。

按 EventID 6008 筛选的 Windows 事件日志

我们没有在服务器上以 14 天为间隔运行的任何计划,而且我发现这不太可能是内存问题,因为服务器有 68GB 的​​ RAM,而且它被填满是不现实的。

任务计划程序

对于每个 6008,也有一个事件 41(内核功率),但这不包含任何有用的信息,所有事件数据都是 0x0

事件 41 错误检查

该服务器运行的是 Windows Server 2012 R2,虽然略显过时,但仍在支持中

答案1

原来是电源问题。奇怪的是,除了上次崩溃时指示灯从通常的绿色变为琥珀色外,电源从未显示任何故障。

一个多月前更换电源后,我们就没再遇到过任何崩溃。仍然不能 100% 确定为什么电源每两周会同时出现故障,但事实就是如此。

答案2

在这种随机问题中,很可能是硬件问题。

请更新所有固件并观察。

如果硬件是 HP,请运行最新的 proliant 支持包。

如果硬件是戴尔,请运行最新的 SSU。(戴尔服务器更新实用程序 (SUU) - 指南和下载

否则,请与制造商联系。

答案3

您可以尝试使用 Nirsoft 的 BlueScreenView 来查看转储数据,希望它能有所帮助。

相关内容