更换 GPU 后随机崩溃并出现黑屏

更换 GPU 后随机崩溃并出现黑屏

将 GPU 更换为较新的型号后,我开始遇到看似随机的 PC 崩溃并黑屏的情况。我以前从未遇到过这样的问题,我不知道哪个部分可能有问题,也不知道如何诊断/排除故障。

最后不会崩溃的配置是:

 - CPU: AMD Ryzen 7 1700 (8c/16t), stock cooler, no oc
 - GPU: MSI GeForce GTX 960 2GB (6 pin), no oc (TDP: 120W)
 - mobo: ASUS PRIME B350M-A
 - RAM: 4 x 8GB 2666
 - PSU: Corsair VS650 650W
 - disk: 1x SSD (OS), 2x HDD 5400RPM
 - cooling: 6x 120mm case-mounted fans
 - screens: 1x 32", 2x 24", plugged to DisplayPort
 - couple USB peripherials like BT, Logitech Unifying, other receivers
 - OS: Windows 10

在此期间,电脑运行正常。值得注意的是,在此之前,也就是 2021 年初,我的电脑也MSI GeForce RTX 2080 Ventus 8GB (2x8 pin), no oc (TDP: 215W)运行正常,没有任何问题。

然后,在 3 月份的某个时候再次更换 GPU 后,PC 开始随机崩溃。升级如下:

  1. 更换了 GTX 960 Gigabyte GeForce RTX 3060 Aorus 12GB (8 pin), no oc (TDP: 170W),使用 DDU 清除驱动程序并安装全新驱动程序后,PC 开始崩溃。
  2. 退回卡并使用Gainward GeForce RTX 3060 Ti Ghost 8GB (8 pin), no oc (TDP: 200W)(我确定它没有用于挖矿或严重超频),使用 DDU 清除驱动程序并安装全新的驱动程序,但 PC 仍然崩溃。
  3. 全新安装 Windows 11 后,PC 仍然崩溃。
  4. 我注意到我的 PSU 经常被列为“立即更换”,因此我购买了全新的Gigabyte P650B 650W电源,但 PC 仍然崩溃。

目前,大多数 PC 部件已有约 6 至 7 年历史,但以下部件除外:

  • RTX 2080 于 2021 年发售时已有 3 年历史
  • 全新技嘉电源
  • 一块硬盘大约有 3 年历史
  • 两根内存条大约有 3 年历史
  • 3060 Aorus 是全新的
  • 3060 Ti Ghost 大约有半年历史

崩溃如下:

它们似乎是随机发生的,在使用 Blender 或视频游戏等 3D 密集型应用程序时,或在 PC 空闲时,或在启动操作系统后立即发生。不过,导致崩溃的一个可靠方法是将一组高度压缩的文件从一个硬盘驱动器解压到另一个硬盘驱动器。

症状如下:

  • 屏幕变黑
  • 蓝牙设备断开连接
  • 在 3060 Aorus 上,风扇将高达 100%
  • 在 3060 Ti Ghost 上,风扇保持原样,但 RGB 灯光变为白色并开始持续闪烁

我还尝试过其他方法:

  • 重新安装 GPU,并用罐装空气清除 PCI 插槽上的灰尘
  • 重新安装所有其他电缆
  • 重新安装 RAM 条
  • 长时间运行 Furmark,GPU 风扇启动,温度保持在 70 摄氏度(158 华氏度)左右

我注意到的其他事情:

  • 其中一个驱动器(用于解压前面提到的压缩文件的源驱动器)在 SMART 中显示黄色警告状态,一些重新分配的扇区和几个无法恢复的扇区。这是一个非操作系统驱动器。
  • 自全新安装 Windows 11 以来,所有驱动器均使用 Bitlocker 加密。自从我换到 GTX 960 以来,它们在使用 Veracrypt 之前就已加密,运行起来非常顺畅。

答案1

当前的问题是 BIOS 固件。

适用于 ASUS B350M-A 的最新稳定版本 5609 在此配置下被证明不稳定。安装 6026 测试版固件解决了此问题。

目前 PC 运行稳定,无论 CPU、GPU 和/或磁盘的负载有多大,都不会导致系统崩溃,并且在长时间空闲期间也很稳定(连续空闲 36 小时,系统没有崩溃)。

两个固件文件均从华硕网站获取。顺便说一句,2017 年的主板在五年后的 2022 年仍在接收固件,这值得称赞。

相关内容