此 vCenter 服务器刚刚升级到 5.1 update 1。我正在检查主机并更新固件,然后将它们从 5.0 的各个版本升级到 5.1u1。
vCenter 5.1u1 似乎有一个有趣的新行为:当主机断开连接后重新连接时,它会将其从维护模式中移除——但非常不一致,我在大约 25-30 次主机重启中看到过这种情况 4 或 5 次。我只在尚未升级到 5.1 的 5.0 主机上看到过这种情况。
在图像中,我将主机置于维护模式,然后将其重新启动到 HP SPP DVD 的自动更新模式。在通常约 40 分钟的更新过程之后,主机重新上线……甚至在记录主机已重新连接的 7 秒之前,vCenter 就向主机发送了退出维护模式的任务。
据我了解,vCenter 唯一应该将主机退出维护模式的情况是当 vCenter 本身将其置于维护模式时(例如 VUM 升级任务)。
为什么此 vCenter 会单方面退出主机由用户启动的维护模式?
编辑,附加信息:
我同时在另外 5 台主机上运行了固件升级。其中两台在重新连接后退出了维护模式,三台没有。退出维护模式的共同因素似乎是他们离线了多长时间;尝试了几次才启动虚拟媒体的两个设备是被淘汰出维护模式的两个设备。
- esx31(上图):45分钟没有反应
- esx19(退出维护):87分钟没有反应
- esx24(维护中):32 分钟无响应
- esx29(维护中):39 分钟无响应
- esx32(处于维护状态):30 分钟无响应
- esx34(退出维护):70分钟没有反应
编辑:断开连接时间的想法似乎只是一种转移注意力的花招,因为它并不是持续发生的。
此外,在vpxd.log
退出维护模式中,任务启动似乎总是紧跟此vim.EnvironmentBrowser.queryProvisioningPolicy
SOAP 调用。以下是这些行,为清晰起见,略作了修剪:
15:27:49.535 [info 'vpxdvpxdVmomi'] [ClientAdapterBase::InvokeOnSoap] Invoke done (esx31, vim.EnvironmentBrowser.queryProvisioningPolicy)
15:27:49.560 [info 'commonvpxLro'] [VpxLRO] -- BEGIN task -- esx31 -- HostSystem.exitMaintenanceMode --
请注意,在未获得退出任务的节点上,事件vim.EnvironmentBrowser.queryProvisioningPolicy
仍会发生。除了退出维护模式引起的额外事件外,在重新连接过程中,我没有看到事件在此之前或之后的任何其他差异。
鉴于日志中提到了配置策略,寻找与自动部署相关的维护模式问题会出现对类似行为的投诉(尽管我根本没有使用自动部署)。
答案1
我曾经在 ESXi 4.1 主机上看到过这种情况,当时补丁意外破坏了 /tmp/scratch 文件夹。您可能需要检查自动退出维护模式的主机上是否仍然存在该目录。
如果它们缺失,您需要使用 mkdir 来创建它。此外,您需要按照以下 VMware KB 文章检查每个主机上的持久暂存是否正确设置: