如何诊断偶尔死机的计算机

如何诊断偶尔死机的计算机

问题

我有一台运行 Windows 10 的台式电脑。大约 1 年以来,我偶尔会遇到电脑停止响应并必须手动重置的情况。我曾经尝试等待几个小时,但它并没有自行恢复。

观察结果

我首先检查的是内存。我用 MemTest86 测试了内存,没有发现任何错误。

事件查看器也不包含任何相关内容。

我注意到的一件事是,当环境温度较高时,这种情况似乎更频繁地发生。现在是夏天,我办公室的环境温度接近 30ºC,这种情况似乎发生得更多。

在冬天,电脑在玩视频游戏或编码视频时会更频繁地死机,尽管在执行较轻的任务时有时会死机。我尝试更新视频驱动程序,也安装旧版本,但似乎没有帮助。

最后一个可疑的是我的 USB 集线器有时接触不良。如果我触摸电线,连接到它的设备会重置,但 PC 本身似乎没问题。

我尝试过

我尝试使用 OpenHardwareMonitor 监控系统并从另一台计算机检查传感器(使用 HTTP 接口),但在计算机冻结时看不到任何奇怪的值。

我还使用 MSI Afterburner / MSI Kombustor 进行了一些压力测试,但在测试运行时计算机并未冻结。

监控传感器并进行 CPU 压力测试会导致其达到高温,但系统保持稳定:

传感器状态的屏幕截图

由于 CPU 承受着巨大的压力,我认为它的温度会达到这么高也是意料之中的事。在温暖的天气和正常使用情况下,CPU 温度保持在 60ºC 左右。

以下是主要硬件:

  • 中央处理器:Intel Core i9-9900K @3.60 GHz
  • 显卡:NVIDIA GeForce RTX 2070 SUPER
  • 主板:MSI MPG Z390 GAMING EDGE AC
  • 内存:2x 32Gb Corsair DDR4-2666,位于插槽 2 和 4

我该怎么做才能找出冻结的原因?

编辑

今天 PC 又死机了,我使用 HWINFO 从另一台 PC 监控它。以下是传感器的最新值。我在这里看不到任何可疑之处:

HWINFO 截图

答案1

您的测试非常出色。您还注意到该问题似乎与,既有环境因素,也有由于 CPU 和/或 GPU 负载过高造成的。

  1. 确认是否加热。使用以下工具信息网选择检查 CPU 和 GPU 温度。

HWinfo64 温度传感器

  1. 可能是热 ID 影响了另一个组件,例如边缘电源。您可以尝试轻轻地使用吹风机加热电脑,看看是否会导致“冻结”(嗯……奇怪的含义反转)。

  2. 您(或其他人)是否进行了以下更改?超频,这可能会导致过热?如果是这样,请稍微回滚一下。请注意信息网还可以显示系统时序、电压和其他设置伟大的细节。

  3. 小心干净的一切,特别是散热器和风扇。虽然有些人建议移除 CPU 和 GPU,重新涂抹导热膏并重新安装,但许多关于如何修复的在线帖子损害通过执行该程序来完成(并且它们通常涉及替换昂贵的零件)——我会避免尝试那种“修理”。

  4. 如果经过所有这些操作后,系统仍然受到热量的影响,请考虑更换备用电源。借用而不是购买,因为它可能不是原因。

相关内容