- 主板:GA-B85M-DS3H-A
- 处理器:酷睿 i5 4430
- 内存:PNY XLR8 DDR3 32GB(4x8GB)1600MHz(MD32768K4D3-1600-X9)
- 电源:EVGA 500 W1 80+
问题
安装所有 32GB RAM 后,系统始终无法通过 MemTest86+ 6.2 测试。第一次测试总是失败,错误数量迅速增加到数百万。尝试运行 Windows 会导致随机重启和停止错误(RAM 错误就是如此)。
我尝试过的方法
- 在插槽 DIMM1 中测试单个 8GB PNY 模块。成功完成 4 次 MemTest。
- 在插槽 DIMM2 中测试单个 8GB PNY 模块。成功完成 4 次 MemTest。
- 在插槽 DIMM3 中测试单个 8GB PNY 模块。成功完成 4 次 MemTest。
- 在插槽 DIMM4 中测试单个 8GB PNY 模块。成功完成 4 次 MemTest。
- 在插槽 DIMM1 中分别单独测试所有四个 8GB PNY DIMM。所有模块均成功完成 4 次 MemTest。
- 在插槽 DIMM1 和 DIMM2 中测试两个 8GB PNY 模块。成功完成 4 次 MemTest。
- 在插槽 DIMM3 和 DIMM4 中测试两个 8GB PNY 模块。成功完成 4 次 MemTest。
- 使用所有插槽中的四个已知良好的 2GB DIMM 测试主板。成功完成 4 次 MemTest。
- 交换插槽中 PNY DIMM 的顺序。没有变化-MemTest 错误仍然发生。
- 将主板 RAM 电压从 1.5v 升至 1.65V。没有变化-MemTest 错误仍然发生。
- 在设置实用程序中使用 RAM 手动设置的各种组合 - 启用/禁用 XMP 配置文件、设置“增加稳定性”预设等。没有变化,MemTest 错误仍然发生。
我认为我可以放心地排除坏 RAM 和坏 RAM 插槽。仅有的如果同时安装所有四个 8GB 模块,则 MemTest 测试会失败。
我测量了电源的电压,即使安装了四根电源棒,那里的一切看起来都很稳定。
在我写这篇文章时,我尝试了最后的办法,即在 BIOS 中手动将 RAM 速度降低到 1066MHz。到目前为止,MemTest 已完成一次测试,第二次测试没有出现任何错误。(以上所有测试均在原生 1600MHz RAM 速度下执行。)这可能允许我使用系统,尽管 RAM 速度会略慢,但这似乎不是永久的解决方案。
每当发生 MemTest 错误时,它们总是发生在 64 位地址总线上的相同位置:
Bit Error Mask: 00000000FF000000
此外,错误绝不会在 4GB 以下发生。换句话说,所有错误都发生在 4GB 和 32GB 之间的地址空间中。
我推断这是 CPU、RAM 和主板之间某种奇怪的交互或时序问题,因为错误非常一致,只发生在一种特定配置中,似乎可以通过降低 RAM 速度来缓解,并且只发生在 4GB 以上。我的问题是:我的 CPU 或主板是不是更有可能是罪魁祸首?
我一直打算将这台机器升级到 Core i7-4790K,所以如果 CPU 可能是罪魁祸首(我知道这些新型号的内存控制器位于 CPU 上),那么它就会很好,因为我无论如何都打算升级它,但我想知道主板本身是否也可能是问题的一部分。也就是说,我不想花钱买 i7 CPU,却遇到完全相同的问题,并发现我还必须更换主板……
建议?
编辑:较慢的 RAM 速度仍然会产生错误,但只有在测试达到第三遍时才会出现。我重新启动测试,只使用一个 CPU 进行活动,只是为了测试 CPU 本身的交互作用。
答案1
这听起来不像是任何组件有缺陷,而是您使用了不兼容的组合。
在同一内存总线上安装多个插槽会增加每条数据线上的电容并减慢上升时间,这可能会导致转换延迟并被误检。电气工程师将这种现象称为“扇出”。
由于内存模块内部存在扇出,因此情况更加复杂。模块上 DRAM 设备的数量和拓扑结构(称为“等级”)将影响您可以成功并行连接的模块数量。
支持大量内存插槽的服务器主板实际上需要缓冲内存,它使用级联缓冲器网络来限制每个缓冲器看到的扇出(以及电容)。缓冲器本身会引起延迟,但它只会随着负载数量的增加而呈对数增加,而对于无缓冲内存,电容会线性增加。
维基百科对此进行了讨论:https://en.wikipedia.org/wiki/Memory_rank
有些主板手册确实提到了这种事情。对于其他主板,您可以从 RAM 兼容性列表中推断出信息。例如,华硕 Z170-A 主板显示双列(手册中称为 DS = 双面)只能同时在该主板上的两个插槽中使用,而不是同时使用四个单列 DIMM 的能力。
答案2
答案3
我看到一些关于该主板 BIOS 的负面评论。我会先检查 BIOS 更新。永远不要在主板上吝啬。
答案4
RAM 也可能出现故障,即使看上去没有。我家的服务器最近遇到了一个问题,与一些冰茶有关的致命事故有关...
我经历了单独更换每个部件的整个过程(2 个 CPU、主板、电源和 2 个 16 GB(2x8GB)RAM 组),当我仅使用一个 RAM 组和一个 CPU 时,一切测试都正常(除了 1 个 CPU 已损坏)。
无论我使用哪种配置,它总是当我只有一个 CPU 和一组 RAM(无论是 16GB 还是 32GB RAM)时,它可以工作,但是当我放入第二个 CPU 并分割 RAM 使得每个组为 16GB 时,服务器无法启动。
直到我完全更换了一组 RAM 后,它才最终正常启动并运行,并且一直如此。
总结:正如 @moab 在他的评论中所说,除非你在兼容系统中测试每个组件,否则你永远无法确定