当我触摸(或稍微摇晃)时 CPU 使用率出现奇怪的情况

当我触摸(或稍微摇晃)时 CPU 使用率出现奇怪的情况

我在 ASUS Z10-PAU8 MB 和 Xeon 1620 v4 + Corsair RMx 850W + 1 HDD + 1 SSD 上进行了设置。

我们注意到,只要轻微触碰服务器(稍微摇晃一下暂时放置服务器的桌子),CPU 负载就会大幅增加(99%),有时甚至会挂起。

继续调查,我们尝试用力摇晃它,主板上的指示灯“CATERR1”变为红色,服务器挂起。

当这种情况发生时,Windows 日志中会出现很多带有“WHEA Logger - 错误类型:内存控制器错误”的消息。https://i.stack.imgur.com/CQMj9.jpg

我们尝试了另一个 DIMM 模块,没有运气,同样的问题,CPU 插座上的引脚看起来都正常。

如果有人对这种行为有任何想法,我们会很高兴。

答案1

很可能是主板坏了。听起来像是 DIMM 插槽、CPU 插槽或两者之间的某个焊点上的某个触点坏了。

如果这也会导致问题,您可以尝试小心地摇动 DIMM 或 CPU 插槽/散热器。此外,您可以用指尖轻轻敲击(确保您完全放电并接地)以从地理上缩小问题范围。

或者,您也可以让一个 DIMM 插槽保持空闲状态 - 如果您可以将其缩小到特定的插槽,请尝试使用单个 DIMM。

不过,它可能位于 RAM 和 CPU 之间。对于服务器,我会更换主板。

答案2

问题解决了。主板背面的 RAM 插槽处有弯曲的腿,我修好了它,现在一切都好了。

相关内容