什么原因可能导致 PCIe 显卡在启动过程中随机出现故障?

什么原因可能导致 PCIe 显卡在启动过程中随机出现故障?

我有一个系统目前让我抓狂,我希望 StackExchange 上的某个人能够指出我所做错的事情。

该计算机是自制的,包括:

  • CPU:Intel Core i7 4790K(原价 4GHz)
  • MB:技嘉 GA-Z97X-Gaming G1 WIFI-BK
  • 内存:G.skill Trident X F3-2400C10Q-32GTX(8GBx4 配套套件)
  • GFX:2x 技嘉 GV-N980G1 GAMING-4GD GTX 980 (SLI)
  • 压水堆:Corsair HX1000i
  • 操作系统:Windows 8.1 Pro

每次我打开机器时,显卡是否能上线都像掷硬币一样。如果我很幸运,显卡就能上电,然后我的主显示器就会收到显示信号(通过 DP 输出)。当这种情况发生时,机器似乎可以正常运行,直到电源循环,尽管它的性能远低于硬件应有的水平(3DMark Fire Strike Extreme 得分约为 8000,而 Futuremark 列出的具有相同 CPU 和显卡的参考系统得分为 10100)。

如果我运气不好,机器会启动,视频会通过集成的 Intel 显卡(我已将其路由到第二台显示器)联机。设备管理器根本检测不到 NVIDIA 卡。它们不会显示为“未知设备”,也不会显示为“启动失败”——它们完全消失了。

按照处理此类情况的常规程序,我已移除并重新安装主板、卡、电源和所有电源连接。我已检查以确保没有可能导致短路的松动导体。我已检查 CPU 和 GPU 温度以确保它们在负载下运行良好,温度限制在正常范围内(GPU 约 65C,CPU 约 55C)。

我对此完全感到困惑。任何建议(无论多么明显)都将不胜感激。

更新:

应评论中的 Journeyman Geek 的要求,我在机器上分别安装了每张显卡,并进行了测试。这似乎确实解决了问题:我使用每张卡启动了系统大约十几次,但系统仍然没有出现故障。此外,3DMark 确认,对于这种使用单个 GPU 的硬件配置,这些卡的单独性能处于平均水平。

因此,这个问题似乎与在 SLI 配置中使用两张卡具体相关。

我目前正在对不同 PCIe 插槽配置(1 和 2 而不是 1 和 3)中的两张卡进行更多测试,以查看主板上是否有坏插槽。

更新 2:

插槽 1&2 配置运行良好,并在 3DMark Fire Strike Extreme 上测试了 9600。(较低,但这是两张双宽卡并排放置时的预期;如果没有重型液体或相变系统,它们会过热并相互热节流。)

在此配置下运行几个测试后,我将卡放回 1&3。现在,在另外十几次启动中,一切都正常工作。系统现在在 FSE 上达到 10800 的基准。

我无论如何也想不出这次与我之前重新安装卡的六次相比可能有什么不同。如果我不能再次重现错误情况,我将继续运行此配置几天,并将我的问题关闭为“由妖精引起”。

答案1

你肯定有一台性能强大的游戏电脑,但我仍然会首先怀疑电源——确认你的电源达到或超过 12V 导轨上的建议瓦数,然后将其与 980 必须满足的规格进行比较。

您提到了 Windows 8.1,所以我还想说查看您的日志,看看是否可以收集到有关为什么您的驱动程序未显示的更多信息。

我在一月份使用两台 980 时遇到了这个问题,但并没有费心进一步调查,因为我升级到了华硕主板和较旧的 Thermaltake 电源,问题就解决了。

相关内容