如何解决“硬件故障”蓝屏问题?

如何解决“硬件故障”蓝屏问题?

更新日期:2011/3/10 (2):再次切换硬盘插槽允许 Windows 加载,但崩溃比以前频繁得多。很明显,问题与硬盘控制器有关……或者系统中其他地方的连接松动 :(

2011 年 3 月 10 日更新:在来回切换组件后,系统开始拒绝启动(没有哔哔声,没有视频)。我将其从机箱中取出,通过将硬盘切换到不同的插槽,它能够再次启动。由于硬件更改,Windows 要求重新启动,我允许它。之后,我的系统无法启动 Windows(在“加载 Windows”屏幕后重新启动)。

此时,我猜测主板上的 RAID 控制器或 SATA 插槽已损坏。我希望无法启动不是由于我在排除故障时造成的后续损坏。但是,我还没有对系统故障进行实际测试,所以我仍然有些困惑。

2011 年 3 月 9 日更新: 将显卡移至另一个 PCIe x16 插槽后,我能够顺利运行测试用例。将其移回原位又立即导致错误。今晚和明天我将花足够的时间将我的 PC 重新组装起来,以便对其进行更严格的测试,并希望能够让自己更加确定。

当然,我刚发布上述内容,测试用例就失败了,并显示相同的错误消息。显然,测试用例并不像我想象的那么可靠。

我的计算机突然崩溃并出现蓝屏,并显示以下文字:

硬件故障

致电您的硬件供应商寻求支持

*系统已停止*

正常使用过程中,崩溃随机发生。到目前为止,我始终能够通过传输大型文件夹的内容来重现此问题...但我不确定这是由文件传输引起的,还是仅仅是因为传输时间太长而导致其他原因触发了此问题。

关于我的硬件

我有双核 Intel CPU 和华硕主板。显卡是 nVidia 的,通过 PCIe 连接。我的硬盘是成对的,通过 SATA 连接到主板上的 RAID 控制器。它们配置为使用 RAID0 配置。

到目前为止我尝试过的

Windows 事件日志中没有任何内容。

WhoCrashed 无法找到任何崩溃记录。

ScanDisk 运行完成(它在 Windows 加载之前启动)并且没有报告任何错误。

MemTest 没有报告错误(覆盖率为 200%)。

系统温度在40至50摄氏度之间,显卡温度在60至80摄氏度之间。

我已将系统精简到最低配置(硬盘、显卡、一个内存模块、主板、CPU、电源)。问题仍然存在。

我通过长时间移除主板电池来重置 CMOS。

然而,这让我排除了一些因素:

这是不是显卡 因为更换我手上的另一张显卡后问题仍然存在。

这是不是硬盘或者任何与软件相关的 因为该问题出现在更换的硬盘上全新安装 Windows 之后。

这是不是硬盘电缆 因为我用新的替换了它们,但问题仍然存在。

这是不是电源 因为用手头上的另一个电源更换后,问题仍然存在。

这是可能不是记忆 因为我尝试在三个不同的内存插槽中安装三种不同的内存模块,但仍然能够重现该问题。

这是可能不是主板接地与机箱的问题 因为我已将主板从机箱中完全移除,但问题仍然出现。

我能做什么来确认问题的原因吗?目前看来,问题出在主板或 CPU 上,但这两个组件都很难更换……此外,这两个组件都比较新(两到三年了)。

我会很乐意编辑我能获得的任何附加信息,和/或集中问题,因为我可以找到更多细节......

答案1

由于您排除了相当多的硬件项目,并且您的系统不允许写入转储,因此很可能是@MattJenkins 提到的处理器、内存或主板的问题。我建议您查看我的帖子尤其是这个流程图(链接包含更多信息):

看来清除灰尘和重置 BIOS 也可能有帮助......

答案2

对于任何与硬件有关的问题,我通常的回答是:

下载 Hiren 的启动 CD:http://www.hirensbootcd.org/download/

将 ISO 刻录到磁盘,然后启动它。它包含许多用于诊断硬件问题的工具 - CPU 测试、内存测试、主板测试。

从您遇到的问题来看,使用提供“老化”测试(对整台计算机进行压力测试)的工具之一可能会获得最佳结果(或最差结果?)。

相关内容