如果“另一个电源管理操作已在进行中”阻止了“确认重启”Ovirt 中无响应的主机,该如何操作?

如果“另一个电源管理操作已在进行中”阻止了“确认重启”Ovirt 中无响应的主机,该如何操作?

问题:

内存不足后,节点开始显示为无响应,但大多数虚拟机实际上都在运行,甚至可以从 ovirt-engine 访问,但有些虚拟机显示为启动,但实际上已关闭。

我决定隔离一个故障节点并重新启动它。我在 UI 中按下“重新启动”,然后继续重新启动一个节点。启动后,它仍然处于无响应状态,并且在此主机上运行的虚拟机处于“未知”状态。

当我点击“确认主机已重新启动”时,我收到以下错误:“另一个电源管理操作已在进行中。”,由于“无响应状态”和“此节点有正在运行的虚拟机”消息,将其置于维护状态也不起作用。

我如何手动隔离主机并让我的虚拟机在其他工作主机上运行?

环境:

  • oVirt 节点 4.3.5.2
  • Ovirt 引擎:4.3.5.5-1.el7

答案1

重新启动管理引擎解决了该问题,我实际上能够使用“确认主机已重新启动”。

在同一节点上重新启动托管引擎所需的步骤,如下所述https://www.ovirt.org/documentation/self-hosted/chap-Troubleshooting.html,连接到节点时,引擎正在运行:

  1. 使用以下方式设置全局维护模式

    hosted-engine --set-maintenance --mode=global
    
  2. 关闭托管引擎虚拟机:

    hosted-engine --vm-shutdown
    
  3. 当虚拟机启动后,重新启动它:

    hosted-engine --vm-start
    

完成这些步骤后,引擎 UI 中的“确认主机已重新启动”将开始工作

相关内容