每 14 天,我们的一台 Windows 服务器就会崩溃。我们一直在努力找出原因,但无济于事。
今天,我们注意到服务器关闭有一个规律,每 14 天发生一次,并且在更改崩溃时间之前大约在同一时间发生 4 次崩溃。
按 EventID 6008 筛选的 Windows 事件日志
我们没有在服务器上以 14 天为间隔运行的任何计划,而且我发现这不太可能是内存问题,因为服务器有 68GB 的 RAM,而且它被填满是不现实的。
对于每个 6008,也有一个事件 41(内核功率),但这不包含任何有用的信息,所有事件数据都是 0x0
该服务器运行的是 Windows Server 2012 R2,虽然略显过时,但仍在支持中
答案1
原来是电源问题。奇怪的是,除了上次崩溃时指示灯从通常的绿色变为琥珀色外,电源从未显示任何故障。
一个多月前更换电源后,我们就没再遇到过任何崩溃。仍然不能 100% 确定为什么电源每两周会同时出现故障,但事实就是如此。
答案2
在这种随机问题中,很可能是硬件问题。
请更新所有固件并观察。
如果硬件是 HP,请运行最新的 proliant 支持包。
如果硬件是戴尔,请运行最新的 SSU。(戴尔服务器更新实用程序 (SUU) - 指南和下载)
否则,请与制造商联系。
答案3
您可以尝试使用 Nirsoft 的 BlueScreenView 来查看转储数据,希望它能有所帮助。