被踢出的心跳节点不会重新加入虚拟 IP 服务

被踢出的心跳节点不会重新加入虚拟 IP 服务

我们有一个 2 节点心跳集群,它为虚拟 IP 提供服务。之前由于错误,节点 1 的网络接口死机,导致集群将节点 1 从虚拟 IP 方踢出。

现在我们已经修复了这个问题,node1 不再能够重新加入虚拟 IP 组。将 node2 设置为待机状态不会触发到 node1 的故障转移。

我不熟悉心跳。是否有任何配置/命令允许我撤销/配置/取消将其列入黑名单?

答案1

经过一番挖掘,结果发现网络接口崩溃期间故障计数已达到极限。因此,资源拒绝迁移回工作节点。我可以使用以下命令查看每个资源的故障计数:

pcs status failcount show <resource_id> [node]

来源 :

$ pcs resource help 

为了解决这个问题,我运行了这个:

crm_resource --cleanup

这清除了我的资源的所有失败计数。(https://clusterlabs.org/pacemaker/doc/en-US/Pacemaker/1.1/html/Pacemaker_Explained/s-failure-handling.html)现在,故障转移已起作用,并且一切都正常。

相关内容