每次我重新启动 ESXi 5 主机时,它都会返回到旧配置(连接到旧数据存储并列出旧虚拟机)。
我发现了一些奇怪的现象,它们可能是问题的部分/根源,但我不确定如何解决:
- 缺少 /bootbank/boot.cfg
- /bootbank 指向 /tmp
- 当我通过 ssh 发出 df -h 时,仅列出磁盘和 NFS 挂载点,没有列出本地磁盘
~ # df -h
Filesystem Size Used Available Use% Mounted on
NFS 1.4T 568.4G 828.7G 41% /vmfs/volumes/isos
NFS 119.2G 60.1G 59.1G 50% /vmfs/volumes/sql
NFS 2.7T 976.2G 1.8T 35% /vmfs/volumes/vms
~ # cd /bootbank/
/tmp # ls
imgdb.tgz scratch vmware-root
关于如何解决这个问题有什么想法吗?
答案1
您是否正在通过 PXE 启动映像?如果您正在使用 PXE 或其他远程启动(如通过 iscsi 启动),并且在进行更新时没有更新基础映像,则这种情况很常见。
答案2
通过 IPMI 重新启动时,我注意到 Shift-R 表示恢复模式。按下后,ESXi 主机启动时没有配置任何数据存储/虚拟机。我设置它们并重新启动。一切似乎都恢复正常:
- /bootbank/boot.cfg 存在
- df -h 列出三个 vfat 卷以及 NFS 卷
谢谢你的建议。我仍然很好奇它是怎么坏的——不过很高兴不用去物理位置重新安装虚拟机管理程序就解决了它!
李
答案3
看一下此 Vmware KB203131 文章,复制如下。
其它硬件也会出现这种情况!在本地磁盘上测试安装,这肯定会起作用。
UCS Blade 在 VMware ESXi 5.0.x 中重启后丢失配置
症状:
- 从 FCoE/iSCSI SAN 启动的 UCS Blade 在重启后恢复到之前的状态。
- ESXi 5.0 启动槽指向 /tmp 和/或不存在 altbootbank。
- 您无法在虚拟机中安装 VMware Tools。
- 您无法修补/更新 ESXi 5.0。
任务失败并显示:
The host returns esxupdate error code: 15. The package manager transaction is not successful. Could not install patches on <hostname>
在 esxupdate.log 中,您会看到类似以下内容的消息:
esxupdate: ERROR: InstallationError: ('Current bootbank /bootbank is not verified and most likely a serious problem was encountered during boot, it is not safe to continue altbootbank install. bootstate is 2, expected value is 0.')
esxupdate: HostImage: DEBUG: Live image has been updated but /altbootbank image has not. This means a reboot is not safe.
esxupdate: HostImage: INFO: Installer <class 'vmware.esximage.Installer.BootBankInstaller.BootBankInstaller'> was not initiated - reason: altbootbank is invalid: Error in loading boot.cfg from bootbank /bootbank: Error parsing bootbank boot.cfg file /bootbank/boot.cfg: [Errno 2] No such file or directory: '/bootbank/boot.cfg'
原因:
FCoE 设备发现可能需要比预期更长的时间,并且当 restore-bootbank jumpstart 插件启动时,FCoE LUN 上的 bootbank 分区仍然不可用。
解决:
这是 VMware ESXi 5.0.x 中的一个已知问题。正在评估此问题的解决方案,以纳入未来版本中。
如果您遇到此问题,请提出支持请求。
要解决此问题,请从本地存储重新安装。