我遇到了一个非常奇怪的问题。
我是一名系统管理员,管理着数十台 Xeon 服务器,但其中一台(用户负载较低)的行为非常奇怪。
服务器规格:
CPU: Intel Xeon E3 1230 V2
MB: Gigabyte Z77N-WIFI, Bios Version F2 (08/13)
RAM: 16GB DDR3 Dualchannel NON-ECC (2x Kingston 99U5471-037.A00LF)
OS: Windows Server 2012 R2 Standard
此服务器托管两台 Hyper-V 计算机。一台是 Linux Debian,另一台是 Windows 7
问题: 服务器每小时左右随机冻结 5-40 秒。所谓冻结,是指服务器不再有 IO 输出、RDP 连接被重置、来自虚拟机的远程 SSH 连接被重置,并且所有活动连接都超时。
当服务器恢复在线时,我可以在任务管理器中看到 CPU 在冻结期间下降到 0%。
事件日志从未记录任何来自冻结的条目,并且之后也不会记录任何来自服务或系统的错误消息。
关于冻结我可以说的是:
- 冻结没有规律
- CPU 利用率过高或过低时,冻结同样随机发生
- 它们在 RAM 利用率低和高时发生
- 这不是网卡问题,因为 CPU 会降到零,即使没有插入电源也会发生这种情况
- HDD 位于好身材
我制作了一个记录响应时间(500 表示超时)的 ping 脚本并让它运行最后一天。
有谁遇到过类似的情况吗?
答案1
问题已经解决了。我不确定最终的解决方案是什么,但它是以下其中之一:
- 我买了一个新的 PSU,因为它的额定功率太低了(原来是 200W,现在是 400W)
- 我重新安装了所有英特尔芯片组驱动程序
- 我重新安装了网卡驱动程序
- 我把内存增加了一倍
现在我已经一个多月没有遇到过任何延迟了。