如果我在运行 ontap 8.x 7 模式的 Netapp 提供的 FC [编辑] LUN 上运行 VMWare 5.x,我应该采取什么步骤来确保虚拟机能够承受最坏的集群节点故障转移情况?HBA 设置?ESX 设置?修改虚拟机的设置?我知道这一切都是由 Netapp 的主机套件处理的,但我们想知道它在做什么和/或自己做。
Netapp 上的 cf 接管通常非常快,但在某些情况下可能需要长达 3 分钟。
答案1
您主要想确保您的虚拟机没有磁盘 IO 问题。安装 VMware 工具将解决 4.x 及更新版本的问题。您还需要在 ESX 主机上设置与超时相关的正确设置,这些设置可在 netapp 网站的 TR-3749 中详细说明
实际上,您使用哪种协议进行集群故障转移并不重要,因为来宾将看到相同的事情 - 他们的磁盘将在短时间内处于离线/只读状态。此脚本可以帮助您设置 NetApp 推荐的设置在虚拟机上,但我很确定 VMware 工具安装会为您完成此操作。
在 ESX/ESXi 端这取决于 ESX/OnTap 的版本您正在运行,但它不是您要编辑的内容。您可以强制 MRU/RR 等,但这只是它发现其 LUN 路径的方式(除非您在切换过程中做了一些奇怪的事情,否则应该设置并忘记)。您实际上无法加快故障转移本身的速度,它取决于控制器启动和同步然后在 NVRAM 中重放数据所需的时间。VMware 和 NetApp 的 PSP/SATP 协同工作管理这些内容。有关更多信息,您可以使用 esxcli 查看(并编辑有限的信息)这些设置。尝试esxcli 存储 nmp和esxcli 存储 san fc深入研究,但就我个人而言,除非我有特殊需要,否则我不会弄乱这些东西,即使你设法挤出一些性能改进,你最终也可能会破坏与未来版本的兼容性等。
对于 HBA 来说,这取决于具体情况,主要要看的是队列深度,但这取决于您如何配置工作负载。在文件管理器方面,您不需要更改队列设置,它应该会根据工作负载自行调整。
如果您正在使用 FC,我强烈建议您至少尝试一下 NFS,它可以让您的生活变得更加轻松。