Xeon 服务器随机冻结几秒钟,没有任何模式或错误

Xeon 服务器随机冻结几秒钟,没有任何模式或错误

我遇到了一个非常奇怪的问题。

我是一名系统管理员,管理着数十台 Xeon 服务器,但其中一台(用户负载较低)的行为非常奇怪。

服务器规格:

CPU: Intel Xeon E3 1230 V2
MB: Gigabyte Z77N-WIFI, Bios Version F2 (08/13)
RAM: 16GB DDR3 Dualchannel NON-ECC (2x Kingston 99U5471-037.A00LF)
OS: Windows Server 2012 R2 Standard

此服务器托管两台 Hyper-V 计算机。一台是 Linux Debian,另一台是 Windows 7

问题: 服务器每小时左右随机冻结 5-40 秒。所谓冻结,是指服务器不再有 IO 输出、RDP 连接被重置、来自虚拟机的远程 SSH 连接被重置,并且所有活动连接都超时。

当服务器恢复在线时,我可以在任务管理器中看到 CPU 在冻结期间下降到 0%。

事件日志从未记录任何来自冻结的条目,并且之后也不会记录任何来自服务或系统的错误消息。

关于冻结我可以说的是:

  • 冻结没有规律
  • CPU 利用率过高或过低时,冻结同样随机发生
  • 它们在 RAM 利用率低和高时发生
  • 这不是网卡问题,因为 CPU 会降到零,即使没有插入电源也会发生这种情况
  • HDD 位于好身材

我制作了一个记录响应时间(500 表示超时)的 ping 脚本并让它运行最后一天。 Ping 统计

有谁遇到过类似的情况吗?

答案1

问题已经解决了。我不确定最终的解决方案是什么,但它是以下其中之一:

  • 我买了一个新的 PSU,因为它的额定功率太低了(原来是 200W,现在是 400W)
  • 我重新安装了所有英特尔芯片组驱动程序
  • 我重新安装了网卡驱动程序
  • 我把内存增加了一倍

现在我已经一个多月没有遇到过任何延迟了。

相关内容