图形密集型应用程序频繁崩溃——我的 GPU 坏了吗?

图形密集型应用程序频繁崩溃——我的 GPU 坏了吗?

最近,我在玩《黑暗之魂》或《GRIP:战斗赛车》等游戏时,遇到了奇怪的崩溃。理论上,我的 GTX 1080 应该能够毫无问题地处理这些问题。崩溃通常是在玩了一段时间后随机出现的。

让我认为是 GPU 的原因在于应用程序同时崩溃。例如:Dark Souls 和 OBS Studio。有时,过了一会儿,整个 GPU 驱动程序似乎崩溃了:屏幕变黑,然后只有主屏幕恢复,而第二台显示器没有恢复,透明度等合成功能不再起作用。

我尽可能地取出并清洁了卡片,但似乎没有任何改变。

我决定彻底重装 Windows,以排除软件问题。然后,在安装驱动程序后,我运行了 Furmark,但几秒钟后就崩溃了,并尝试运行 GRIP,但比赛开始后不久就崩溃了。

我使用这个 GPU 仅大约一年,虽然我购买了二手的,但一周前从未发生过这种情况。

一些系统信息:

  • 操作系统名称 Microsoft Windows 10 Pro 版本 10.0.19045 内部版本 19045
  • 系统类型 基于 x64 的 PC 处理器 AMD Ryzen 5 5500, 3600 Mhz, 6
  • 核心,12 个逻辑处理器 底板制造商 Micro-Star
  • International Co., Ltd 底板产品 B450 GAMING PLUS MAX (MS-7B86)
  • 已安装物理内存 (RAM) 16,0 GB 适配器
  • 描述 NVIDIA GeForce GTX 1080 适配器 RAM (1.048.576) 字节
  • 驱动程序版本 31.0.15.3640 分辨率 1920 x 1080 x 60 赫兹

以下是从事件查看器复制的一些崩溃报告示例:

错误应用程序名称:DARKSOULS.exe,版本:1.0.2.0,时间戳:0x557f2fd0 错误模块名称:d3d9.dll,版本:0.0.0.0,时间戳:0x5b71c6f0 异常代码:0xc0000005

错误应用程序名称:obs-browser-page.exe,版本:0.0.0.0,时间戳:0x63b8a351 错误模块名称:KERNELBASE.dll,版本:10.0.19041.2130,时间戳:0xb0fac6c9 异常代码:0xe0000008

错误应用程序名称:dwm.exe,版本:10.0.19041.746,时间戳:0x6be51595 错误模块名称:KERNELBASE.dll,版本:10.0.19041.2130,时间戳:0xb0fac6c9 异常代码:0xc00001ad

已检测到 TDR。应用程序必须关闭。错误代码:7 (pid=7600 tid=3384 furmark.exe 32bit)

错误应用程序名称:FurMark.exe,版本:1.35.0.0,时间戳:0x64933012 错误模块名称:nvoglv32.dll,版本:31.0.15.3640,时间戳:0x649602c9 异常代码:0xc0000409

错误应用程序名称:Grip-Win64-Shipping.exe,版本:4.17.2.0,时间戳:0x62511845 错误模块名称:nvwgf2umx.dll,版本:31.0.15.3640,时间戳:0x6496040f 异常代码:0xc0000005

对于 GRIP 崩溃,虚幻引擎错误弹出窗口显示“低级致命错误”,但在我复制之前它就消失了。通过使用 GPU-Z 监控 GPU 传感器,似乎崩溃发生在短暂的 GPU 负载峰值期间:

GPU-Z 读数

PerfCap 的原因是“vRel”。

我该如何进一步诊断?我的显卡还有希望吗?我能做些什么来解决这个问题而不用更换它?

编辑:我刚刚意识到,由于我拥有 MSI 版本的 1080(特别是 GAMING X 8G),因此它是出厂超频的。我通过启用 Nvidia 调试模式移除了 OC,到目前为止,GRIP 似乎很稳定,GPU 负载峰值保持在 100% 以下。但 GRIP 并不是要求最高的游戏,而且我很确定当崩溃开始发生时,我已经启用了调试模式。我可能在初始故障排除中通过重置驱动程序设置禁用了它。以出厂超频运行的 GPU 如此不稳定,这似乎仍然很奇怪。

编辑 2:我使用的是 2015 年左右的 Corsair CS650M PSU,用于之前的构建。也许 GPU 只是没有获得足够的功率?我当然宁愿更换 PSU 而不是 GPU。根据 Newegg PSU 计算器,我的系统只需要 600W,但我意识到我的 PSU 已经很旧了,而且根据一些消息来源,功率下降是一个问题。

相关内容