安装在线备用内存有意义吗?

安装在线备用内存有意义吗?

我正在使用 HPDL360p第 8 代。我需要一台非常可靠的服务器,因此我使用带有备用驱动器的 RAID 1,并且还添加了额外的电源。但我应该安装在线备用内存吗?还是这只是在浪费钱?

答案1

这不值得。使用 ECC RAM 并运行 HP 管理代理,很容易检测到坏内存。通常需要采取几个步骤才能发现影响操作的重大问题。在标准支持下,RAM 更换是下一个工作日,因此无需通过添加备用 DIMM 来复杂化 RAM 安排。

我遇到的最严重的 HP ProLiant 内存问题,是系统在一周内多次出现 ECC 警报后,最终导致服务器崩溃。错误出现后,服务器通过 ASR 重新启动,机器恢复时坏的 DIMM 被禁用。这是HP ProLiant DL580 G4系统和错误日志如下......

0004 Repaired       22:21  12/01/2008 22:21  12/01/2008 0001
LOG: Corrected Memory Error threshold exceeded (Slot 1, Memory Module 1)

0005 Repaired       20:41  12/06/2008 20:43  12/06/2008 0002
LOG: POST Error: 201-Memory Error Single-bit error occured during memory initialization, Board 1, DIMM 1. Bank 
containing DIMM(s) has been disabled.

过去,我安装了许多HP ProLiant DL740 服务器具有 RAID5 样式内存阵列。因此,16GB RAM 服务器实际上在 8 个 DIMMS 的热插拔组中安装了 20GB。对于我部署并运行了 5 年以上的数十台服务器,只有一个 DIMM 模块出现故障。数字...

编辑:
您计划在高频交易环境中使用它。您询问了在这样的服务器中使用备用 RAM 的延迟问题。通常,对于低延迟应用程序,我会禁用主机系统上的内存故障前检查。这是 HP 在其第 7 页上的建议为低延迟应用程序配置 HP ProLiant 服务器 BIOS白皮书。这是一个监控和风险的问题。我很少遇到 DIMM 故障。您更关心速度还是弹性?在硬件层面,您无法同时获得两者……

答案2

我认为这只是在浪费钱。内存已经具有 ECC。话虽如此,如果你的服务器将全天候使用,并且绝不有停机时间,那么这可能有意义。如果您将其用于虚拟机管理程序,那么关闭所有虚拟机、关闭系统电源并更换损坏的内存芯片将很简单。

根据我的经验,高端服务器内存芯片确实会时不时出现问题并需要更换。

答案3

这对您来说是一个非常容易的决定 - 启用在线备用模式或锁步模式需要花费多少成本,然后考虑基于内存的服务丢失在服务器的整个生命周期内会造成多大的影响。

在作为现有故障转移群集一部分的服务器(Oracle RAC、vSphere 等)中,我们不会使用这些方法中的任何一种,但在我们的服务器无法以任何实际/经济的方式进行群集时,我们会使用它。

只有您可以根据成本/收益做出决定,但该技术确实有效,我知道在过去的 2.5 年里我们避免了其中一台服务器的两次整个系统中断,对于我们来说,这项投资是值得的,您的里程可能会有所不同。

相关内容