确定系统硬冻结的原因

确定系统硬冻结的原因

两年前我买了一台新的游戏电脑,以前买过,没有出现过问题。但从那以后,电脑会随机死机,有时一个小时后死机,有时几天后死机。

冻结时,系统会变得无响应,屏幕上的任何内容都会冻结,并且我听到电视(通过 HDMI 连接)发出可怕的刺耳噪音。声音是一团可怕的高音调噪音。声音很大而且很烦人。除非我关闭 PC 电源,否则它会一直持续下去。

键盘/鼠标变得无响应,大写锁定键不再亮,电源/重置按钮不起作用 - 唯一的解决方案是通过电源关闭电源。

我只用这台电脑来玩游戏,所以说这种情况只在玩游戏时发生可能不准确,但到目前为止,情况确实如此。

眼镜:

  • Windows 10,保持更新
  • 英特尔酷睿 I5-6600K 3.50 GHz,6 M 处理器缓存 6,适用于 LGA 1151
  • NVIDIA GeForce GTX 970
  • Mushkin MKNSSDRE1TB Reactor 1TB SATA III 6Gb 2.5 英寸固态硬盘
  • 华硕 H170 ATX 主板
  • Crucial 16GB 套件 (4GBx4) DDR4-2133 MT/s (PC4-17000) SR x8 非 ECC UDIMM 288 针台式机内存
  • Cooler Master Hyper 212 EVO - 带 120mm PWM 风扇的 CPU 冷却器 (RR-212E-20PK-R2)
  • EVGA 600 B1 80+ BRONZE,600W 连续功率,3 年保修电源 100-B1-0600-KR

迄今为止的故障排除:

  • 我已经更新了 Windows 和 Nvidia 驱动程序
  • 我已将 bios 更新至 v3403(购买后首次更新)
  • 我已经运行Windows内存诊断程序 - 没有问题。
  • 我查看了可靠性历史记录和事件日志。唯一相关的问题是“之前的系统关闭是意外的”。
  • Memtest86,所有测试(耗时几个小时,零错误)
  • 我已经进行了 GPU 压力测试(furmark,挖矿时从未出现问题)
  • 我用 prime95 测试了 CPU,监测了它的温度。我让它运行的时间比我在游戏中见过的这种温度(高达 60 摄氏度)要长。没有问题。
  • 我已经运行了英特尔处理器诊断工具,没有问题

我不知道还能做什么。我需要日志记录 - 它可以告诉我哪里出了问题,但在硬重启后仍然存在。

它会随机发生 - 有时每隔几个小时发生一次,有时只发生一次,有时根本不发生。很难说,但我相信它只发生在我玩的 50% 左右的游戏中。例如,它最常发生在 Rocket League 中,但从未在任何 Lego 系列游戏中发生过。它发生在 Kerbal Space Program 中,但从未在经过大量修改的 Minecraft 中发生过。它发生在 Just Cause 3 中,但从未在 Fallout 4 中发生过,等等。

答案1

遗憾的是,这些问题很难追踪,因为它们可能是硬件问题,也可能是软件问题。我最近运行的一款游戏安装了“反作弊”软件(安装驱动程序和 2 个监控进程)。它所做的一件事就是挂接键盘中断。不幸的是,它存在缺陷,在游戏关闭时并不总是能正确自行清除——这会导致最终锁定——无论是在关闭时还是在重新启动游戏时。

关于发出可怕的声音的问题 —— 这是否只发生在扬声器已经发出声音时?如果它在冻结时启动,那就更奇怪了,但通常如果正在播放声音,并且向卡提供声音的过程不会向声道提供新数据,则声音输出缓冲区中的任何内容通常会反复重复,从而导致某种非随机重复声音。

由于您注意到键盘灯没有切换,这表明存在软件问题——因为唯一高于键盘的 IRQ 是系统时间,我****认为****用于调度。但是,由于驱动程序也处理硬件,因此仍然可能是硬件向软件驱动程序提供了一些虚假信息,导致其锁定。

在硬件方面,这可能是电源尖峰(不太可能,但正如有人提到的,电源调节 UPS(发出干净正弦波的 UPS)将是一个“测试”(以及防止电源尖峰的一个很好的补充)。最终猜测是温度相关(你做过任何温度监测吗?可以尝试免费工具“Open Hardware Monitor”http://openhardwaremonitor.org/。实际上只有 GPU+CPU 才有,但应该可以让您了解温度以及温度升高时是否会出现挂起。

但是在软件方面,除了确保您拥有最新的硬件驱动程序之外,您还可以尝试在玩发生挂起的游戏时断开任何不需要的硬件外围设备,以及关闭所有可能的后台软件和服务。

这东西从第一天开始就挂了?很遗憾你不能轻易尝试 Win7,因为 Win10 已经与许多 SW 兼容问题有关。如果挂起变得越来越频繁,你有没有清理过电脑内部的灰尘?(冷却器和任何可能吹风扇的地方——在取下零件之前一定要接地……并确保拔下并排出电容器。我已经因为静电或没有确保没有残留电量而损坏了不止一块硬件。我认为没有一天中的某个时间、一周中的某一天(或一个月中的某一天)挂起发生得更频繁?我是否也可以假设你玩什么游戏并不重要?

事实上,这种情况在某些游戏中比其他游戏更常见——而且从你的描述来看,这似乎是对游戏要求更高的游戏,这让我想到了显卡电源+温度。你能试试更新的显卡吗?具体来说是 GTX1070 或 GTX1080。先别笑……我问这个问题的原因是……我有一台 GTX980,有更多与图形相关的不稳定问题。

附注:我不得不买一个新的电源,因为戴尔提供的 1100W 没有合适的连接来支持两个完整的 8 针连接器以获得额外的电源(这是他们的 T7500 的一个设计缺陷——你甚至可以在他们的维护手册照片中看到。两个可用于额外显卡电源的 12V 75W 针脚位于同一导轨上!)。我不得不用 1300W 更换它——这消除了很多问题。但是,这张卡是一张双 GPU 卡,运行时会发热——这增加了它自身的不稳定。

无论如何—— Nvidia 的较新显卡——比如 1080——耗电量更少!——只有 2 个 6 针连接器——而且运行更凉爽!所以……如果你当前的显卡运行在热端,我发现 10XX 系列与旧型号针脚兼容(将自动适应较旧的 PCEe 标准,但性能会有所损失)。

当我的设备装有戴尔电源时,通常一切都会运行良好,而且通常确实如此,除了某些类型的图形负载。比如当我进行 Win7 硬件评级测试时,其中一项测试导致机器使用 980 卡可靠地重置。

您注意到一种模式这一事实非常好——这给了我们一些解决这个问题的希望。希望我给您提供了一些想法——因为这些问题通常很难确定。祝您好运!

答案2

可能性只有少数:热量、功率、内存、CPU、主板。

您已测试了所有组件,并且它们已通过所有测试。任何组件出现问题都应该在事件日志中留下一些痕迹或显示 BSOD 屏幕,但什么都没有。

您遇到的关机情况与电源突然关闭类似。然后计算机会突然关闭,事件日志中唯一的痕迹就是您收到的“上次系统意外关闭”消息。

一种猜测是你的 PSU 有故障,你可以更换另一个进行测试品质更佳。

如果这没有帮助,那么问题可能出在电源的电涌上。您可以购买或借用带电池的 UPS 来验证这一理论。

答案3

我不是电脑专家,但听起来好像是电脑内部出了问题,而不是程序本身出了问题,因为如果你在电脑上玩游戏,很有可能是 CPU 性能低下,导致电脑在同时处理太多事情时卡死。可能是因为你同时运行了太多事情,也可能是因为你没有空间。

答案可能是这样的:

  • 释放一些空间
  • 不要一次运行太多东西(只运行游戏)
  • 关闭所有程序让它冷静下来,然后让它离开,简单
  • 或者只需打开电脑并为其换一个新的 CPU?

相关内容