esxi - 虚拟机看门狗功能/自动重启失败的虚拟机

esxi - 虚拟机看门狗功能/自动重启失败的虚拟机

我正在使用 ESXi 6.5(免费许可证)。偶尔,在 esxi 主机上运行的其中一个虚拟服务器(ubuntu 18.04)会冻结。症状:服务器不再通过 http(s) 或 ssh 访问,并且不响应 ping。它也无法通过控制台访问。vmware 工具状态从“是”变为“已安装但未运行”)。虚拟机保持“开机”状态。esxi 主机和在其上运行的其他虚拟机都保持完全正常运行。没有明显的资源问题。我可以通过 esxi Web 界面手动重新启动虚拟机,或通过 vSphere Mobile 应用程序远程重新启动失败的虚拟机。

显然,我需要调查这台虚拟机周期性出现故障的原因,但这是一个单独的问题,而不是这篇文章的主题。

我的问题是:是否有可以启用的看门狗功能来自动重启 Linux 虚拟机?如果内置看门狗功能失效(我无法通过 Web 界面找到任何功能),是否有办法通过连接到 esxi 主机 ssh 服务并使用脚本化的 cli 命令重启虚拟机来实现此目的?(我可以使用 ping 进行监控)

谢谢,乔恩

答案1

当 VMware 工具的 HA 功能无响应时,vSphere 能够重新启动虚拟机:

在此处输入图片描述

ESXi 的免费版本不具备此功能。


基本上,您可以使用命令通过 SSH 重新启动虚拟机vim-cmd

~ # vim-cmd vmsvc/power.reset
Insufficient arguments.
Usage: power.reset vmid

Reset the specified virtual machine.

您可以使用以下命令获取 vmid:

vim-cmd vmsvc/getallvms

但是我不太确定 ESXi 的免费许可证是否允许这样做。该许可证对主机的功能有严格的限制,而我现在手边没有带有免费许可证的主机可以测试它。

如果允许,您可以使用它来通过外部监控重新启动虚拟机。

相关内容