如果网络连接丢失,ESX 将重新启动所有虚拟机

如果网络连接丢失,ESX 将重新启动所有虚拟机

本周末我们计划升级思科交换机上的 IOS。此交换机连接了我们的三台 ESX 服务器以及 ESX 服务器使用的 iSCSI SAN。

过去,我们发现需要重新启动交换机时,所有正在运行的虚拟机都会关闭,然后由 ESX 主机重新启动。我试图避免这种情况,因为这不是一个正常关机事件。

我可以在 VirtualCenter 中进行配置更改来防止这种情况发生吗?或者有其他想法可以解释为什么这种情况会发生在与 VirtualCenter 无关的地方?

答案1

我知道这个问题的答案是在问题提出后很长一段时间才出现的,但我最近遇到了这个问题,并找到了一种与重启虚拟机完全不同的解决方案。

如果您有 VMware HA 群集,则在 VirtualCenter 中右键单击群集,然后选择编辑设置

在“集群设置”对话框中,选择左侧的 VMware HA。在右侧窗格中,您将看到一个标题为默认集群设置 设置主机隔离响应下拉至“让虚拟机保持开启状态

这样,当网络连接恢复时,主机仍然在那里并可以继续执行其工作。

答案2

听起来您的 VMware HA 设置有问题。请注意,如果您将所有 ESX 网络都插入单个交换机,那么您的网络就需要重新设计一下。

如果您有 ESX 群集(尤其是启用了 HA 的群集),则每个主机应具有两个单独的服务控制台端口,这些端口连接到两个单独的物理网卡,这些物理网卡插入两个单独的交换机,这样当您丢失单个交换机(或将其取出进行维护)时,您就不会失去对主机的管理访问权限。如果 ESX 主机配置在 HA 群集中,并且它们与彼此的服务控制台接口失去联系的时间超过 15 秒,HA 将尝试重新启动受保护的虚拟机,并且(默认情况下)将关闭正在运行的虚拟机实例。

答案3

在客户操作系统的某处隐藏着一个存储超时值。当 Windows 无法访问其磁盘超过 x 秒时,它就会崩溃。

HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\Disk
Name    TimeOutValue
Typ     REG_DWORD
Value   60 (dezimal) for 60 Seconds

答案4

抱歉,如果我说得不清楚,但您是说您将虚拟机存储在 iSCSI 盒上,并且每个主机只连接到一个交换机吗?

如果情况确实如此,那么关闭该交换机将绝对 100% 杀死存储在 iSCSI SAN 盒上的每个虚拟机,因为每个主机不仅会丢失其网络,还会丢失其在 iSCSI SAN 盒上的持久存储。

除了建立冗余之外,应对这种变化的唯一方法是在交换机中断期间将每个虚拟机通过 Storage vMotion 迁移到每个主机的本地存储,然后在交换机恢复正常运行时迁移回 SAN。

如果这不是您的情况,请您添加一些额外的细节来澄清情况。

相关内容