我正在 X99 芯片组上构建高规格工作站,我发现 64GB 的 DDR4(非 ECC)RAM 相当实惠。
这让我感到疑惑,因为我的工作负载中的数据完整性非常重要;我特别想问一个问题,损坏和内存错误的预期频率是多少,以及 ECC 内存在什么样的容量级别开始变得有意义。
我们在这里平衡各种变量。
- 系统稳定性/数据完整性/数据损坏率(不仅受 RAM 类型的影响,还受 RAM 的数量/密度的影响)
- 成本
- 速度
配置事物的不同方法包括:
无 ECC,高端 i7 CPU,可超频,RAM 也稍快一些。这个比较便宜。
Xeon CPU,不允许 OC,支持 ECC RAM,还有更多 RAM 选项(reg/buff'd),并且还可以使用更大容量的 RAM。价格更贵。
这有点相关这个问题但我想问一个更具体的问题,关于我应该如何平衡这些因素,因为有时以明显更低的成本获得更快的速度,但数据完整性保证略有降低仍然可以获胜,特别是在我们不清楚处于服务器/工作站线的哪一侧的情况下。
还有一些因素,例如,对于非 ECC“消费者”类型的系统,您可以通过内存测试来“筛选”它们的稳定性,这可能是一项重大的时间投资。还应考虑停机成本和所涉及的工作量。
答案1
我想将此作为评论留下,但我认为我的担忧已得到充分缓解(比如 95%),所以我自己回答。
这对此答案的评论举一些人们发现数据错误率非常低的轶事。这个错误率对我来说肯定足够低,因为我不需要某种大量的 9 正常运行时间保证。无论如何,最重要的数据必须始终进行校验和并存储在多个独立副本中。
但进一步看这个问题/担忧,我想我问的问题可能是不可知这类信息需要大规模的数据收集和测试,但实际上从未实现过。考虑到大多数人不会像我一样连续运行 memtest86 至少 3 天,而且大多数人仍然从未遇到错误,进一步担心这个问题极有可能只是在浪费我的时间。