网络故障后 CMAN 如何重新启动

网络故障后 CMAN 如何重新启动

我尝试在 centos 6.5 上使用 pacemaker/cman 配置 3 节点 HA 集群。STONITH 已禁用 ( pcs property set stonith-enabled=false)。

当我模拟网络问题(iptables -A INPUT -s $OTHER_NODES_IP -j DROP)时,主资源被移动到另一个节点,并在发生故障的节点上停止。

当我再次启用网络(iptables -D INPUT -s $OTHER_NODES_IP -j DROP)时,故障节点无法自动加入集群。

在日志中我们有:corosync[3323]: cman killed by node 3 because we were killed by cman_tool or other application

cman 如何重新启动而不是被杀死?

答案1

这里的想法是如果 cman 与集群失去联系,则将被终止。这称为“隔离”。在此期间,节点将与集群的其余部分分离。如果未经审核就将其重新投入生产,则可能会在节点中出现一些相当严重的损坏或未定义的行为。

这里的想法是,通过隔离故障节点,您可以帮助确保数据完整性。一旦您修复了故障并验证了节点已恢复最新状态,您就可以轻松重新启动 cman。

相关内容