我正在使用 OVirt 版本 4.2.3.8-1.el7 连接到 2 台 IBM PureFlex 服务器,总共有 10 个节点(5+5)。
OVirt 突然与所有节点失去连接,但这些节点中的虚拟机正常运行。我收到所有节点的以下错误:
VDSM Node6 command GetCapabilitiesAsyncVDS failed: Message timeout which can be caused by communication issues
节点可以通过 SSH 访问,并且我可以从 OVirt 管理机器通过 SSH 访问这些节点。
我曾经重新启动过 OVirt 管理服务器,它暂时可以连接到节点,但是过了一段时间问题又再次出现。
有人能帮我解决这个问题吗?
答案1
我只能给你一份清单:
您能从每个节点 ping 通引擎(管理机器)吗?您能从引擎 ping 通所有节点吗?
您是否更改了任何内容?您是否对节点或引擎发布了任何更新?您是否有引擎备份?
有人更改了底层网络吗?您的网络上最近是否激活了 IPv6?IPv6 在虚拟机中是可以的,但对于 ovirt 基础架构(尤其是您正在运行的 oVirt 版本)来说,这可能会导致问题。
此外,您还可以尝试联系非常有帮助的 oVirt 社区。