每 2 个月发生一次随机崩溃和内存错误

每 2 个月发生一次随机崩溃和内存错误

当我在二月中旬第一次组装这台机器时,我遇到了一些稳定性问题,我将其追溯到某根有故障的 RAM(内存测试失败,如果这是唯一的 RAM,则无法启动)。当然,我更换了这根 RAM。

一切稳定后,一切都很顺利,直到大约 2 个月后。

现在,大约每 6-8 周,系统就会变得不稳定;一开始它每天会崩溃一次,最后会达到几乎持续崩溃的程度。Windows BugCheck 代码几乎完全与内存错误有关(或偶尔出现的 NTFS 错误,这些错误可能是由内存错误引起的)。使用内存诊断工具可以检测到内存错误。

到目前为止,“解决方案”当它变得不稳定时,采取以下步骤:

  1. 关闭机器电源。
  2. 取下壳盖。
  3. 取出所有内存条;将它们(在静电袋中)随机摆放,这样它们就不会按照取出时的顺序重新摆放。不知道这是否重要,但我一直都是这么做的。
  4. 使用罐装空气彻底清除所有组件上的灰尘,但不能去除 HSF。
  5. 更换 RAM。
  6. 重新启动机器。

完成此操作后,我将可以正常使用 6-8 周,并且内存诊断不会显示任何错误。

我还没有测试过的东西

  • 只需关闭机器 30 分钟左右(机器通常处于睡眠状态且不会重置)。
  • 无需移除 RAM DIMM 即可除尘

我的技术相当熟练(白天是程序员,晚上是业余爱好者),但到目前为止,这还是让我困惑。有人知道是因为灰尘、工期延长,还是我在施工过程中可能遗漏了(看似)微不足道的东西吗?零件清单如下:

最相关的部分:

  • 华硕 M3A79-T DX 主板
  • AMD Phenom II X4 940 Deneb(原厂 3.0GHz,通过 17.5x200 [原厂 FSB] 超频至 3.5,虽然超频已排除是导致问题的原因;在我超频前几个月它就已经这样了)
  • 8GB(4x2048MB Corsair Dominator PC8500/DDR2-1066)
  • CoolerMaster HAF 932(包含该部件,因为机箱基本上是一个巨大的网状笼子)

附加零件(以防万一):

  • 2 个蓝宝石 ATI Radeon 4870 1GB,PCIe x16 双 CrossfireX
  • Corsair TX850 850 电源,带单个 +12v 导轨,70 安培
  • Thermaltake SpinQ 铝 HSF
  • 3 个 SATA 硬盘、2 个 EIDE DVD-ROM
  • 2x Afermarket 120mm Thermaltake Case 风扇,因为有空间。

任何想法都值得赞赏!

答案1

我遇到过类似的问题,结果发现是热胀冷缩。电子元件的加热和冷却会导致它们发生微小的移动,随着时间的推移,它们可能会“松动”,导致触点开始失效。

我不确定湿度是否也起到了一定作用,在这种情况下,触点也可能会被稍微腐蚀,从而加剧接触不良。

延长运行时间应该不是问题,您多久重启一次系统?如果至少每周一次,那么我敢说我不会责怪操作系统。

尝试降低机箱内的温度,您已经有 2 个风扇了,您能安装更多风扇或改善机箱内的气流吗?在 PC 开机/关机时将最低/最高温度降至最低应该可以减少热量转移的机会。

我不能保证这是你的问题,但我以前遇到过这种情况,当时住在一个炎热潮湿的地区,没有空调。

相关内容