当部分(但不是全部)存储路径发生故障时,ESX 将关闭虚拟机

当部分(但不是全部)存储路径发生故障时,ESX 将关闭虚拟机

我已经等待 VMware 支持一个小时了,并且相信 serverfault 可以抢先给出答案!

我在 6 台 HP 刀片上运行 ESX 4.0 和 4.1,使用 FibreChannel LUN 存储。周末我们进行了一些 FC 网络维护,并关闭了 ESX 主机到存储阵列 (EMC Clariion) 的 4 条路径中的 2 条。发生这种情况时,所有 6 台 ESX 主机都关闭了所有虚拟机。

我在活动中看到了这样的消息:

Path redundancy to storage device naa.600.... degraded. Path vmhba0:.... down. 2 remaining active paths Affected datastores: ....

这是意料之中的。3 分钟后:

Guest OS shutdown for vm1 (由 vpxuser 提供)

vm1 is powered off(用户“用户”)

如果还有好的路径,为什么会这样做?我没有在任何地方看到这样的设置。谢谢!

答案1

正如我们在评论中发现的那样,这似乎并且实际上就是 HA 隔离反应。

为了让答案更有价值:为了避免此类事故,我建议通过配置服务控制台(ESX)/管理端口(ESXi)为 HA 设置另一条网络路径,该路径将使用与主网络堆栈完全分开的路径(vSwitch、pNIC、物理交换机、UPS、电源电路)。

相关内容