常规 RAM 多久会出错一次?
一般来说,它实际上影响任何事情的可能性有多大(包括这里的静默数据损坏,但不包括对某些永远不会被读取的数据的更改)?
编辑:我还想知道 DDR2 和 DDR3 在这方面是否存在差异。
答案1
您正在寻找平均故障间隔时间(平均无故障时间)和平均故障时间(平均故障时间)。
这两者都取决于 RAM 的质量(可能存在缺陷)及其故障率。故障率主要取决于设备总使用时间和单元发生故障的加速因子。其他参数包括温度、正常运行时间和能量……
详细介绍此内容的文档是Hybrid Memory Products Ltd - SRAM 模块 - MTBF 分析。在此示例中,使用的内存持续一生中数百年来。你可以看到各种内存制造商都报告了同样的事情,这里是金斯顿的一个例子:
我们的流程运行良好,平均故障间隔时间超过 500 年!
要点是ECC 可以掩盖硬件错误或过度使用,这就是为什么你经常看到它安装在服务器中的原因,因为他们不想冒内存故障的风险。
来自其他问题,有一项研究对此得出了不同的结果,每月 50 - 167 个错误,而不是经过长时间使用后才出现错误。现在谁说的是真的?Google 是否正确使用了 MemTest?
谷歌已经就此问题展开了激烈争论。看http://blogs.zdnet.com/storage/?p=638看看这究竟如何影响现代系统。
但这是基于 2009 年前几年的数据得出的,因此现在的情况可能会有所不同。