问题:
内存不足后,节点开始显示为无响应,但大多数虚拟机实际上都在运行,甚至可以从 ovirt-engine 访问,但有些虚拟机显示为启动,但实际上已关闭。
我决定隔离一个故障节点并重新启动它。我在 UI 中按下“重新启动”,然后继续重新启动一个节点。启动后,它仍然处于无响应状态,并且在此主机上运行的虚拟机处于“未知”状态。
当我点击“确认主机已重新启动”时,我收到以下错误:“另一个电源管理操作已在进行中。”,由于“无响应状态”和“此节点有正在运行的虚拟机”消息,将其置于维护状态也不起作用。
我如何手动隔离主机并让我的虚拟机在其他工作主机上运行?
环境:
- oVirt 节点 4.3.5.2
- Ovirt 引擎:4.3.5.5-1.el7
答案1
重新启动管理引擎解决了该问题,我实际上能够使用“确认主机已重新启动”。
在同一节点上重新启动托管引擎所需的步骤,如下所述https://www.ovirt.org/documentation/self-hosted/chap-Troubleshooting.html,连接到节点时,引擎正在运行:
使用以下方式设置全局维护模式
hosted-engine --set-maintenance --mode=global
关闭托管引擎虚拟机:
hosted-engine --vm-shutdown
当虚拟机启动后,重新启动它:
hosted-engine --vm-start
完成这些步骤后,引擎 UI 中的“确认主机已重新启动”将开始工作