硬冻结会阻止物理重置按钮工作

硬冻结会阻止物理重置按钮工作

我有一台改装过的 PC 用作服务器。它组装于 2014 年初,在技嘉 Z87-HD3 上配备 Intel Core i7-4770。它运行得相当可靠,直到 2017 年初开始间歇性冻结(每隔几周到几个月)。没有内核日志,甚至 pstore 崩溃数据或网络控制台也没有产生任何有意义的信息。物理屏幕空白,网络无响应,10 秒粒度的指标显示与 CPU、RAM 或磁盘上的负载没有关联。所有 LED 和驱动器仍在运行,但显然不再有 IO。RAM 已经过测试并被验证为良好,没有虚假段错误或任何表明间歇性硬件问题的迹象。只是硬冻结。

现在来看看非常有趣的部分:一旦系统进入此状态,物理重置按钮将完全停止工作。一旦我按下它,什么都没有发生。它肯定是物理上工作的,因为当系统不处于该状态时,它 100% 工作。我用万用表检查了 PSU 的电压,它们都很好。我仍然可以通过按下电源按钮 5 秒钟来重置服务器,之后它就可以正常启动了。

所以我完全不知道这里发生了什么,也不知道哪个硬件该负责。我有逻辑分析仪,我可以访问 USB 示波器,但没有采样率超过 100MSPS 的设备,所以我无法探测实际总线。如果能对可能发生的情况有任何见解,我将不胜感激。

答案1

因此,经过大量战略性更换(主板、电源、CPU)后,我得到了差异确认(测试系统遇到问题,原始系统不再出现问题),即 CPU 出现故障。结果非常出乎意料,因为从未触发过 MCE,通常 MCE 会在硬锁定之前出现。

由于这块主板不幸没有 Trace Hub/JTAG 连接器,并且 Haswell 平台上没有内置 USB3 调试功能,我不知道到底出了什么问题。可以肯定的是,芯片最终处于无法从重置中释放的状态(自检失败、电源轨未启动……)。可能与引入FIVR(全集成稳压器)在 Haswell 中,但这只是猜测。

如果遇到此问题,不一定是 CPU 的问题,也可能是主板或 PSU 出现故障(或完全是其他原因)。我发布此信息只是为了完整性,也为了让大家知道这确实也可能是 CPU 故障(尽管这种可能性仍然很小)。

答案2

我之前见过两次这种情况,都是在 x86 笔记本电脑上。发生这种情况时,屏幕会冻结,LED 灯保持亮起,但按钮不起作用。唯一起作用的按钮是电源按钮,但按住 5 秒钟即可。

笔记本电脑通常没有重置按钮,所以我不能完全确定您的问题,但证据表明存在硬件故障。我看到的是电路板上的焊点出现裂缝,无论是由于缺陷、时间还是机械应力(足够的热冷循环)。每个坏的焊点都会注入电噪声。如果焊点足够多或位置正确,数字电路就会锁定,导致整个电路板冻结。这不是在操作系统级别或 BIOS 中,而是在硬件中。在这种状态下,只有电源按钮的按住功能会起作用,因为它使用不锁定的模拟电路。

解决办法是将电路板放入再加热循环(在机器内部),快速熔化焊料,使裂缝重新焊接并消失。

我找到了一家专门从事此类维修的公司。

在 eBay 上,导航至专业服务 -> 修复与维修服务 -> 计算机修复与维修服务。卖家是“NYClaptoptech”。我搜索了品牌/型号,他们有匹配的“待售商品”。我以购买 PC 相同的方式购买了这项服务,使用了相同的结账流程。(使用购买方法设置服务电话确实似乎很奇怪。)我寄出了主板,两周后就拿回来了。费用:120 美元。他们的服务很一般,您只需致电他们安排维修即可。

相关内容