完整上下文(请参阅下文的 TLDR):
我大约一年半前组装了一台定制 PC,因此所有组件应该仍在保修期内(如果需要,我可以提供完整的组件列表)。这台 PC 运行 Windows 10,我主要用它来玩游戏和编程。CPU 是 i7-8700,因此不需要超频。
昨天我开始遇到蓝屏。第一次蓝屏发生在我在 Android Studio 中运行构建时(即高 CPU 负载情况)。后续的蓝屏似乎也主要与高 CPU 负载有关。我大多数时候都可以启动到 Windows 登录屏幕,但当我登录时(输入密码后),大约 50% 的时间会出现蓝屏。如果我能够登录,系统在闲置时会运行良好,但执行一些 CPU 密集型操作也会导致大多数时候出现蓝屏(例如,我尝试运行 Prime95,结果导致立即崩溃)。大多数蓝屏与任何特定驱动程序无关(使用 NirSoft bluescreenview 和 WinDbg 检查了其中一些),除了由 netio.sys 引起的蓝屏。此外,蓝屏没有一个一致的代码,而是一直不同。以下是我记得的一些蓝屏的列表:
- IRQL_NOT_LESS_OR_EQUAL
- KMODE_EXCEPTION_NOT_HANDLED
- 意外的内核模式陷阱
- 尝试执行_不执行_内存
由于这是一个非常分散的错误模式,我开始怀疑是硬件问题,所以我取出了显卡并断开了系统的辅助硬盘。这样就剩下主板、CPU、系统驱动器(nvme ssd)、RAM(2 根内存条)和 PSU,以及 2 个机箱风扇和 CPU 风扇的极简设置。
使用这种非常简单的设置,系统和以前一样不稳定,在上述相同情况下出现蓝屏。为了确保这不是 Windows 或硬盘问题,我还从 USB 启动了 Ubuntu Live 系统,当 CPU 处于负载状态时,它也不稳定(即屏幕冻结,无法恢复)。我还运行了一次 Windows memchk,没有发现任何错误,所以我相信也可以排除 RAM 问题。
系统上也没有太多灰尘,因为我经常清洁它,而且没有任何可见的组件损坏。我还仔细检查了所有连接器是否连接正确,甚至重新安装了 CPU。
基于系统在高 CPU 负载下大多不稳定的事实,我认为存在一些电源传输问题,这可能是由于主板或电源引起的,或者是 CPU 本身损坏了(但我认为这种情况不太可能发生,因为它可能根本无法工作)。
不幸的是,我没有任何备用组件来进行明确的测试来确定哪个组件真正导致了该问题,并且如果不购买新的组件,我也无法快速获得任何组件。最好的选择是同时 RMA 主板、CPU 和 PSU,即使我不确定哪一个真的坏了?或者有更好的方法来修复这个问题?
总结: 我怀疑我的 CPU、主板和/或 PSU 有故障。我没有任何备用组件来更换它们并确定哪一个/哪些有故障。我应该直接 RMA 所有三个组件还是有更好的方法(例如,购买新的来更换,然后在确定哪个坏了之后再寄回)?