Dell PowerEdge T-620 - 在 BIOS 中选择内存模式

Dell PowerEdge T-620 - 在 BIOS 中选择内存模式

Memory Mode我正在尝试在 BIOS 中 配置具有双处理器的 Dell PowerEdge T620:用户手册|技术指南

该系统具有 384GB 的 DDR3 LRDIMM 内存,我可以选择以下任意模式:

  1. 优化器模式
  2. 备用模式
  3. 镜像模式
  4. 高级 ECC 模式
  5. 配备高级 ECC 的备用电源
  6. 戴尔故障恢复模式

除此之外,由于所有 DIMM 都相同,因此内存配置允许我设置Node Interleaving为“启用”或“禁用”,并附有以下节点交错描述:

如果系统配置了匹配的内存,此字段将启用节点交叉。如果设置为“禁用”(默认),系统将支持非统一内存架构 (NUMA)(非对称)内存配置。仅当内存配置可以支持交叉时,此字段才处于活动状态。

该系统将运行普罗克斯莫克斯托管虚拟机。

您会选择哪种模式?为什么?您会启用节点交错吗?为什么?

答案1

来自 mellanox

节点交错 - 禁用节点交错时,NUMA 模式启用。相反,启用节点交错意味着内存在内存节点之间交错,并且操作系统没有 NUMA 呈现。出于性能原因,我们希望禁用交错(并启用 NUMA),从而确保对于任何给定的逻辑处理器,内存始终分配给本地 NUMA 节点。

尝试描述正在发生的事情:

  • 最简单的情况是,您有一个 CPU 和两个(或四个)DIMM 插槽。内存控制器现在位于 CPU 内,因此理想情况下,当给定 CPU 内的核心需要 RAM 中的数据时,您希望它从最近的 RAM(从其内存控制器到其最近的 DIMM 插槽)获取数据。在这个单 CPU 场景中无需担心。
  • 您有两个(或更多)CPU、两个(或更多)不同的内存控制器,但它们可以通过另一个 CPU 内存控制器访问 RAM,以到达其 DIMM 并访问 500+ GB 的总 RAM 或您可能拥有的任何内存。那么您会怎么做...
    • 有两种方法可以做到这一点(我认为)。简单的方法是交错并始终访问其他每个 CPU 的 DIMMS,但要付出代价:内存时序会发挥作用,因此您总是使用最慢(最长)的访问时间作为所有访问时间的相同时间。否则,您将被限制为总 RAM = 一个 CPU 可用的 RAM,而不是 2、4 或 8 个 CPU。因此,当通过本地 dimm 访问进程所在的 CPU 的内存控制器的本地 RAM 时,它可能很快,但现在是基于访问最远的 DIMM 的(长)时间,以便所有 RAM 都可以显示为共享内存。我相信这就是为什么交错 = 性能下降。NUMA = 非统一内存访问。因为内存访问可以很远,所以时间本质上会有所不同,非均匀。但是 BIOS/EFI 和 CPU 内存控制器可以通过 NUMA 模型处理所有这些。这就是为什么现在一切都是 NUMA。我很确定你不想要交错;除非你从可靠的来源获得指示,出于特定原因使用它,否则不要使用交错。如果有人知道这样的原因,我会很有兴趣听听。

事实上,ECC 内存比非 ECC 常规台式机内存要慢,因为它必须进行错误检查。但不要断章取义。如果您重视可靠性和可信赖性,那么可以使用高级 ECC 模式。但如果您的目标是全力以赴的性能,那么高级(或任何)ECC 模式可能不是理想的选择,我认为最好的选择是适合您特定机箱的 #1 优化器模式... 我必须阅读戴尔对其菜单产品的定义。

答案2

我更喜欢高级 ECC。优化模式仅支持使用 x4 设备宽度的内存模块的单设备数据校正 (SDDC)。它不施加任何特定的插槽填充要求。高级错误校正码 (ECC) 模式将 SDDC 从基于 x4 DRAM 的 DIMM 扩展到 x4 和 x8 DRAM。这可以防止正常运行期间出现单个 DRAM 芯片故障。限制是内存模块的大小、速度和技术必须相同。相同的 DIMM 成对安装。由于您可以从一开始就订购具有此类模块兼容性的服务器,因此使用 AECC 而不是优化是没有问题的。

请注意,优化模式和 AECC 模式都将允许全部内存可用。

如果服务器的电源正常,那么 RAM 模块就没有出现问题的实际原因,而且出现问题的概率很低。

如果要确保在发生内存故障(可能性很低)的情况下不必打开服务器,您可以选择备用模式。在此模式下,每个通道保留一个等级作为备用。如果在等级上检测到持续的可纠正错误,则将此等级的数据复制到备用等级,并禁用发生故障的等级。操作系统可用的内存会按每个通道一个等级减少。

例如,在具有 16x 4 GB 单列内存模块的双处理器配置中,可用的系统内存为:3/4(列数/通道) × 16 (内存模块) × 4 GB = 48 GB,而不是 16 1x (内存模块) × 4 GB = 64 GB。

镜像就像内存的 RAID 1。缺点是,在镜像配置中,总可用系统内存是总安装物理内存的一半,与 RAID 1 中的 HDD 完全一样。因此,如果您真的需要最大程度的保护,您可以选择这个,但在这种情况下,您将只有 192 GB(一半) 跟...共事。

故障恢复内存 (FRM) 是较新的 PowerEdge 服务器中引入的一种操作模式。该模式建立了一个故障恢复内存区域,VMware ESXi 等虚拟机管理程序可以使用它来加载 vmkernel、关键应用程序或服务,以最大限度地提高系统可用性。​​操作系统使用从平台公开的恢复区域并映射进程的地址范围以实施恢复能力。这非常适合用于 ESXi 安装。FRM 为虚拟机管理程序创建了一个高度恢复的内存区域,保护它免受严重内存错误的影响。借助 VMware 可靠内存功能,vSphere 5.5 及更高版本可以利用此区域,为虚拟机管理程序提供强大的保护,防止内存故障导致整个系统崩溃。

相关内容