诊断随机电源故障和 POST 故障

诊断随机电源故障和 POST 故障

我有一台笔记本电脑(东芝 Satellite C650),在过去的一年里,它开始出现一些相当奇怪的故障行为,其中一些更奇怪的行为如下:

  1. 它会随机关闭

  2. 它会随机地无法发布

  3. 启动时随机无法进行任何硬盘访问(开机自检后卡在闪烁的光标处)

起初我以为这是由过热引起的,但 BIOS 并未报告已发生热故障,也没有任何传感器读取接近临界关机的值,我曾将其运行在 85C 下(故障曾发生在低至 30C 的温度下)但根据我能找到的所有文档,这远低于临界关机温度,甚至远离组件损坏的程度。

第二个猜测是间歇性电源故障,然而这似乎也不太可能,因为故障只发生在 Windows 7 x64 ultimate 下,而在 Arch Linux 下(撰写本文时运行内核 4.0.6,在我返回时运行 4.0.7)还没有发生过这种情况,而且我经常连续数周启动到那个分区,而 Windows 系统会在几个小时甚至几天后崩溃。

我怀疑的第三件事是内存模块出现故障,这是基于过去的经验,当模块出现故障时,Windows 会蓝屏,但 Linux 会继续运行(也许它映射了坏内存,也许我的使用模式不同,所以它永远不会写入特定内存,无论如何)但对每个模块进行 48 小时的 memtestx86+ 测试,对两个模块进行另外 48 小时的测试,让我有理由相信情况并非如此。

第四个猜测是软件故障,但是我不知道 Windows 是否保留了任何有用的日志,而且我对该平台的了解也不足以对其进行诊断。

第五个结论是硬盘控制器故障,但 12H SMART 测试报告 0 个错误,所以我可以合理地得出事实并非如此的结论。

第六个也是最后一个结论是一般硬件故障,同样,我不完全确定如何诊断这个问题,也不完全确定为什么 Linux 能够解决它而 Windows 却不能,我敢打赌这是不太可能的选择之一。

至于计算机有时永远无法进行开机自检......这是另一个问题,我不确定如何调试,这里的结论可能是某种硬件故障。

如何重现:重新启动计算机,无论是软重置还是硬重置,都会发生两次,软重置的概率似乎为 70% 左右,而硬重置的概率只有 50% 左右,从 Linux 重新启动时似乎更有可能发生这种情况(也许硬件不喜欢 Linux?),完全关闭并等待 5-10 秒后再开机即可解决这个问题。

至于不加载引导加载程序(特别是根本没有报告任何硬盘访问,没有可听见的硬盘读取声音,也没有任何硬盘指示灯活动),不确定如何调试它,但我敢打赌它与其他 BIOS 问题有关。

最简单的解决方案就是更换机器,但我更感兴趣的是弄清楚是什么导致了这些看似相关的错误,因为这听起来更有趣。

相关内容