我的计算机不定期死机

我的计算机不定期死机

我的计算机已经开始不定期地死机长达三周了。

请注意,这个问题会随着我尝试的每件事而改变。(有关更多详细信息)

会发生什么

  • 我的电脑死机了,视频停止了。(没有图形故障,只是停止了)
  • 声音也停止了。
  • 有时,我的 G-15 键盘屏幕会随机闪烁,我看到的字符不在正确的位置。通常这种情况会持续 1-2 秒左右,然后我的电脑就会死机。
  • 我必须按住电源按钮 4 秒钟才能关闭计算机。
  • 我仍然听到硬盘和风扇在运转。
  • 有时它可以一整天都没有问题,但有时每次我重新启动计算机时它就会一直冻结,我不得​​不把它留在那里一整天。
  • 有时我的鼠标会随机冻结一小段时间(比如 0.01 到 0.2 秒),通常在冻结之前。
  • 与我系统上上一个视频卡出现问题(驱动程序错误)时不同,“操作中心”没有发现任何错误。
  • 我的 G-15 LCD 屏幕也冻结了。
  • 有时我的 G-15 LCD 屏幕在重负载下会闪烁并且字符会暂时偏移。
  • 现在,大多数情况下,BIOS 硬盘启动顺序会因某种原因而反转,每次启动时我都必须将其设置为正确的顺序并保存。(可能无关,不确定,但它是昨天开始的)

我目前所做的

  • 我以前也遇到过类似的问题,而且我更换了硬盘(它有故障),所以我测试了我的软件 RAID-0 阵列,它有故障,所以我更换了它。(我用这个部件重新安装了 Windows 7)。我还拔掉了我的辅助硬盘,进行了测试。
  • 我的 CPU 运行温度大约为 100 摄氏度,我清除了风扇和散热器之间的灰尘,现在温度在 45-55 之间。
  • 我运行了 CPU 压力测试,测试过程中它没有冻结(Prime95在所有核心上使用)
  • 运行一次内存测试(使用memtest86+),没有错误。
  • ati-tools使用和运行 GPU 压力测试,furmark测试期间没有出现卡顿。(也没有伪影)
  • 当我拿到显卡时,我遇到了一些问题,但我认为通过更新驱动程序已经解决了这个问题。
  • 我检查了 BIOS 设置中的电压,它们看起来一切正常(我认为是 ±0.2)。
  • 我在计算机上使用外部硬盘上的 Fedora 15 运行,没有任何问题(除了无法加载 Gnome 3 并恢复为 Gnome 2,我不想安装驱动程序,因为我在多台计算机上使用它)我用它将文件从 raid 阵列备份到我的 1TB 硬盘上,以便重新安装 Windows。(因此崩溃只发生在 Windows 上)[外部硬盘直接插在 SATA 端口上]
  • 我联系了 EVGA(我的显卡供应商)并向他们指出了这个问题,我正在寻找答案。
  • 在 Fedora 15 上运行sensors并得到以下输出:http://pastebin.com/0BHJnAvu
  • 在 Fedora 15 上运行了 6 次短暂的不同 CPU 压力测试(还没有找到任何完整的 Linux 压力测试程序),它没有崩溃。
  • 将我的 CPU 的导热膏换成了 Artic Silver 5,并对 CPU 进行了压力测试,温度在空闲时为 50,然后最高为 64,并在测试过程中慢慢降至 62。
  • 使用临时显卡运行了一些压力测试,一切正常。
  • 使用我的原始显卡运行 furmark 压力测试,它再次冻结。GPU 温度为 74C,CPU 温度为 58C,主板温度为 40C 或 45C(不知道 SpeedFan 测得的哪个温度)。
  • 同时运行了 furmark 压力测试和 CPU 压力测试,结果:http://pastebin.com/2t6PLpdJ
  • 我已经使用我的电脑大约 2 个小时了,没有给它施加压力,也没有出现过崩溃。我还禁用了AMD Cool'n'quietBIOS 上的该功能,以便更规律地为 CPU 供电。当我Furmark没有使用 C'n'q 运行时,我的电脑没有死机,但我遇到了“驱动程序内核错误”,Furmark在运行 CPU 压力测试时,它恢复了(并崩溃了)。电脑最终在我不在的时候死机了,但这次我的屏幕只是进入了睡眠状态,我无法唤醒它。
  • 使用 nTune 中的稳定性测试器,我的电脑再次冻结(与以前一样)。我注意到 Speedfan 给我的 -12V 为 -16.97V,-5V 为 -8.78V。
  • 我已经将我的 G-15 换成另一个基本的 USB 键盘(HP),并且我运行了furmark大约 10 分钟,每 60 秒运行一次 CPU 稳定性测试,持续 30 秒,我的电脑还没有崩溃。
  • 在没有 G-15 的情况下进行了一些扩展测试,它像往常一样冻结。
  • 移除了 nForce 硬盘控制器。
  • 禁用 NVIDIA nForce SATA 控制器中端口 0 和端口 1 的命令排队(来自日志的错误)
  • 使用 CPUID HwMonitor,电压如下:http://pastebin.com/dfM7p4jV
  • 更改了主板BIOS中的某些配置:禁用PEG Link Mode、更改AI TuningStandard、禁用1394 Controller、禁用HD Audio、禁用JMicron RAID controller和禁用SATA Raid
  • “一点希望”,我的电脑在观看 YouTube 视频时冻结了,但在连续 10 小时的测试中 GPU 和 CPU 并没有冻结。
  • 我已将 BIOS 恢复为默认值,并且:禁用PEG Link Mode、禁用HD Audio、禁用JMicron RAID Controler、禁用Serial Port Address、禁用Parallel Port Address和禁用Onboard 1394 Controller
  • 我更换了 750GB 硬盘的 SATA 电缆,还更换了插入它们的插槽(1->2、2->3、3->4)。
  • 将我的显卡的省电功能从“自适应”更改为“最大性能”。
  • 运行 ECGA OC 扫描仪,没有出现冻结和伪影
  • 我为我的 G-15 键盘和 G-500 鼠标安装了 Logitech 驱动程序,然后重新启动并冻结。
  • 我删除了 G-15 键盘和 G-500 鼠标的 Logitech 驱动程序,但它仍然冻结。
  • 在更换了硬盘、显卡和电源之外的所有部件后,我的电脑运行良好,没有遇到任何问题(这与我遇到问题的旧主板安装的 Windows 完全相同)。拆下主板后,我发现一些弯曲的电容器(2),这可能是问题的根源。由于这几乎显然是这些电容器导致的主板问题,我将接受与此解决方案最相关的答案。

当它发生时

  • 当我玩电子游戏时(大部分时间)
  • 当我玩 Flash 游戏时 (第二多)
  • 当我查看桌面背景时(当我打开窗口时很少发生这种情况,但有时会发生)
  • 当我的显卡和 CPU 承受压力时。
  • 有时我的显卡会承受压力。
  • 有时我的 CPU 会面临压力。

眼镜

  • Windows 7 x64 家庭高级版
  • 主板:M2N-SLI Deluxe
  • 显卡:EVGA GTX 570(非超频版)[来自 EVGA 网站的 nVidia 驱动程序版本 275.33]
  • 中央处理器: AMD Phenom 9950 x2 @ 2.6GHz
  • 内存:金士顿 4x2GB 双通道(非常基本的内存条)
  • 硬盘:raid-0 中为 2x250GB(Western digital caviar)+ 1TB(WD caviar black),我用 750GB(WD caviar black)替换了 raid 阵列[是的,我从 raid 配置中删除了该阵列]
  • 750W 电源
  • 绝不超频。
  • 4-5 周前发生过几次断电事件,但问题并没有立即出现。(当时我不在家,所以我的电脑关机了)
  • 过去 24 小时的事件日志(警告、错误和严重错误):http://pastebin.com/Bvvk31T7

我想感谢所有参与的人,看到这么多人愿意帮助别人真是太好了。有很多很棒的答案可能会帮助将来遇到类似问题的人(至少我希望如此)。

在这种情况下,我如何才能成功查明当前的硬件问题?(如果是硬件问题)

答案1

100 摄氏度太热了!您的处理器可能已经受到一些损坏。但为了乐观起见,我建议再运行 memtest86 两次,以确保问题不是内存。您确定时间和速度检测正确吗?

您是否检查过主板上的电容器是否损坏或膨胀?如果不是主板问题,则可能是您的 PSU 出现故障,或者无法为硬件供电。在我看来,这听起来是最可能的原因。

使用 CoreTemp 测量 CPU 温度,因为它是最准确的程序之一。不要使用 ATI Tool,因为它与 Windows 7 不兼容。请尝试使用 RivaTuner。

答案2

首先,对一个有完整记录的问题 +1。这让我们的帮助变得异常容易。

到目前为止,您已经进行了很多硬件测试,大多数都没有出现问题。但是,这仍然可能是 CPU 过热问题(这种情况很常见,而且很糟糕)。当您清理灰尘时,您是否看到 CPU 和散热器之间有导热膏?如果有,它是否已经干涸或变旧了?我建议购买一小管 Arctic Silver 导热膏(7 美元),并将一些涂在 CPU 上。

如果这不是问题所在,那么我强烈建议您开始检查您的操作系统,看看它是否有任何问题。您说您已经在它上面运行了 Fedora?我建议刻录一张 Linux LiveCD 并从它启动。尝试使用它作为您的操作系统一段时间,浏览和播放音乐/视频等。如果您没有遇到崩溃,则意味着它要么是 Windows 问题,要么是 HDD 问题(因为您没有在实时环境中使用它)。我会(从 LiveCD)运行磁盘检查以确保万无一失。如果一切正常,我们可以放心地说它是 Windows。

在这种情况下,您需要确定是您的操作系统损坏了,还是您安装了某些程序,这些程序正在运行某种服务,导致您的计算机被锁定。尝试使用 Windows 安全模式,并使用它一段时间(我知道,分辨率太差了……我很抱歉)。如果几天内没有出现冻结,那么我们可以将问题缩小到 Windows 操作系统问题,在这种情况下,您需要查看备份或重新安装。

如果您要重新安装操作系统,请确保备份所有内容...

在此处输入图片描述

http://xkcd.com/612/

编辑:在 LiveCD 会话中运行时,打开终端并输入sensors。如果安装了该程序(仅限 Linux),它将为您提供有关电源电压、CPU 温度、主板温度以及您需要了解的所有其他信息的详细信息。在 LiveCD 会话中监控这些信息应该可以为您提供强有力的指示,让您知道这是硬件问题还是软件问题。

编辑2:根据您所说的通过 eSATA 在另一个硬盘上运行 Fedora 并且没有遇到任何崩溃的情况,我不得不说这是一个软件问题,也许是驱动程序问题。如果您可以运行 Fedora,比如说整整一周而没有崩溃,那么肯定是 Windows 的问题或弃用/错误的驱动程序。您运行 Fedora 多长时间了?您是否尝试过用它看电影、玩游戏等?

答案3

我首先想到的是你的电源可能出问题了。玩游戏或看 YouTube 可能会使你的显卡进入高速运转状态并增加功耗。另外注意那些 CPU 温度 100 度...哎呀

答案4

使用 nTune 中的稳定性测试器,我的电脑再次冻结(与以前一样)。我注意到 Speedfan 给我的 -12V 为 -16.97V,-5V 为 -8.78V。

更换电源。这些电压远远超出规格,可能是导致问题的原因。

编辑:如今,负极轨很少使用;但是,如果系统未处于负载状态,则 HWMonitor 温度对于温度传感器 2 来说太高。这可能是冷却系统、主板或电源的问题。

相关内容