我有一个全新的 Dell VRTX 盒,设置为运行 HA Hyper-V 虚拟机的故障转移群集。这是我第一次设置群集,也是我第一次使用这些盒,所以我肯定我错过了什么。
虚拟机在访问位于群集共享卷上的 VHD(x) 文件时遇到高磁盘延迟和糟糕的性能。
VRTX 具有 10 x 900 GB 10K SAS 驱动器(采用 RAID 6 配置),并且 VRTX 具有冗余共享 PERC 8 控制器。两个刀片都可以完全访问虚拟磁盘。安装了两个 M520 刀片,每个刀片有 128 GB RAM。为 PERC 8 控制器配置了 MPIO。刀片上的操作系统是 Server 2012(不是 R2)。
RAID 6 阵列被分成一个小的(8 GB)卷用于集群仲裁见证,以及一个大的(6.5 TB)卷用于集群共享卷(在节点上安装为 C:\ClusterStorage\Volume1)
磁盘访问缓慢的示例:登录 Server 2012 VM 并自动启动服务器管理器。磁盘访问率达到 100%,写入速度约为 20 MB,读取速度约为 500 KB,平均响应时间超过 1000 毫秒,有时会达到 4000-5000 毫秒左右。延迟确实让我担心。
我在配置中需要注意什么?使用 VHD 还是 VHDX、动态还是静态似乎都无所谓。
答案1
我在使用双 SPERC8 的 VRTX 时也遇到了完全相同的性能问题。目前我解决这个问题的方法是将双配置更改为单配置。这样我就可以使用写回功能,其性能要好得多。
- 具体步骤:
- 移除第二个 SPERC 8 控制器
- 移除第二个扩展器
- 重新连接内部 SAS 连接
- 将底盘降级至 1.25(与升级相同,无需特殊步骤)
- 删除所有 VD(如果需要,备份数据/VM)
- 对整个 VRTX 进行电源循环(移除并重新连接电源线以确保安全)
- 创建启用回写功能的 VD
要查看性能差异,请查看此/我的帖子: http://en.community.dell.com/support-forums/servers/f/906/t/19587459.aspx
更新:
测试结果:
双 PERC / RAID6 / 直写:读取 2500 MB/s 写入 200 MB/s
双 PERC / RAID10 / 直写:读取 2500 MB/s 写入 400 MB/s
单 PERC / RAID6 / 回写:读取 2500 MB/s 写入 2700 MB/s
只要双 PERC 必须遵循直写策略,我就会坚持使用单 PERC 设置
答案2
这:
容错共享 PERC 8 卡配置 — [...] 在此配置中创建的虚拟磁盘的默认缓存策略为直写。在此模式下,数据写入磁盘后,写入完成信息将返回到主机。
是这最终的性能杀手。如果您的应用程序支持写回缓存策略,并且不会导致写入数据出现不一致,请将其更改为写回缓存策略。请注意,我不知道 PERC8 缓存是否以及通过哪种机制镜像到其他实例。由于缓存的数据需要从两个控制器访问,因此显然有必要保持一致性。
答案3
不再需要移除第二个 SPERC 控制器才能使用回写而不是 Erik 帖子中描述的直写。您现在可以从 CMC 禁用第二个 PERC8 控制器。在当前固件 (1.35) 中,第二个禁用的控制器可以设置为禁用,如果主活动控制器发生故障,则需要手动干预才能激活。补丁说明中没有详细介绍此功能的实用性,但此“修复”旨在允许人们启用回写并摆脱使用直写的两个控制器时糟糕的性能。
自动故障转移(冷故障转移,导致断开连接)是一项稍后发布的功能。稍后才会发布实际的“主动/主动”固件更新,这将允许“实时”故障转移而无需停机。
脚步:
- 下载 VRTX CMC 固件版本 1.35 或更高版本。
- 关闭所有刀片。
- 在CMC界面中,按“Chassis Overview > Update”。
- 选中“CMC 固件”标题中的 CMC 控制器的两个复选框,然后按“应用 CMC 更新”。
- 输入 CMC 固件文件的位置并应用它。
- CMC 将显示其进度。上传大约需要 8 分钟,应用更新再花几分钟。应用更新后,CMC 将重新启动,您将被踢出 Web 界面。
- CMC 重新启动后,浏览至“存储 > 控制器 > 故障排除”部分。
- 对于您选择的 SPERC,选择“禁用 RAID 控制器”选项并应用。这将重新启动您的存储组件。
- 重新启动后,转到“存储>虚拟磁盘>管理”,选择“编辑:写入策略”,然后对所有虚拟磁盘选择“写回”而不是“写通”(除非您有理由不这样做)。
- 上述更改将立即执行,但仍建议在“机箱概览 > 电源 > 控制”下使用“重置 CMC(热启动)”再次重置 CMC。
- 启动已关闭的刀片。
这样,您就可以在 VRTX 中安装第二个 PERC8,以防另一个出现故障。但是,如果出现故障,您必须进行手动干预才能进行故障转移。我认为这主要适用于难以到达的位置(没有 IT 人员或戴尔支持技术人员难以访问的远程办公室)。这也是我们使用它的原因。
希望到今年年底,我们将拥有自动故障转移功能,然后在明年推出启用回写功能的真正主动/主动配置(同步缓存)。我不会指望同步缓存固件修复……我怀疑这对戴尔来说并不容易。
答案4
在 ESXi(每个 VRTX 刀片中)中安装 VirtuCache,并将其缓存到 PCIe 规格的 NVME SSD 中,该 SSD 位于主机本地,或者您可以缓存到主机 RAM。VRTX 有很多 PCIe 插槽,因此请在其中一个插槽中插入 400 美元的 1.6TB Samsung PM1725 NVME SSD,并将其用作 VirtuCahe 的缓存介质。更多详细信息请点击此处https://virtunetsystems.com/improving-storage-performance-of-dell-poweredge-vrtx/