3 节点 Pacemaker 设置显示 1 个节点 2 次,名称相同,一个在线,一个离线

3 节点 Pacemaker 设置显示 1 个节点 2 次,名称相同,一个在线,一个离线

所以我得到了:machine001,machine002,machine003。

machine001 有 2 个资源,machine002 有 1 个资源。通常它们不会运行在同一台主机上,除非 machine002 处于待机状态。

最近,我看到machine002出现了2次。1次在线,1次离线。

检查后sudo crm_mon -R发现它们有不同的节点 ID。

我尝试删除节点 ID,但系统拒绝了。我尝试删除节点名称,但系统提示有一个同名的活动节点。

我进去sudo crm configure edit后发现配置如下:

(111) machine001 \
    standby=off
(222) machine002 \
    standby=off
(333) machine003 \
    standby=off
(12345) machine002
other_settings... \

因此,我删除了该行(12345) machine002,保存并提交 CIB...并machine002从输出中完全消失crm_mon,并且输出似乎一直在尝试再次找到它...

恢复它的唯一方法是重新启动该节点上的 corosync 和 pacemaker。

我不知道这是怎么回事。有人能给我指明正确的方向吗?

编辑:请求的 corosync.conf 文件:

totem {
    version: 2

    cluster_name: debian
    token: 3000

    transport: udp

    token_retransmits_before_loss_const: 10
    join: 60
    consensus: 3600
    vsftype: none
    max_messages: 20
    clear_node_high_bit: yes
    threads: 0
    rrp_mode: none

    crypto_cipher: none
    crypto_hash: none

    interface {
        ringnumber: 0
        bindnetaddr: 192.168.0.0
        mcastaddr: 239.255.64.1
        mcastport: 5405
        ttl: 1
    }
}

logging {
    fileline: off
    to_stderr: no

    to_logfile: yes
    logfile: /var/log/corosync/corosync.log

    to_syslog: no

    syslog_facility: daemon

    debug: off

    timestamp: on
    logger_subsys {
        subsys: QUORUM
        debug: off
    }
}

quorum {
    expected_votes: 3
}

nodelist {
    node {
        ring0_addr: 192.168.0.25
        name: machine001
        id: 1
    }
    node {
        ring0_addr: 192.168.0.26
        name: machine002
        id: 2
    }
    node {
        ring0_addr: 192.168.0.27
        name: machine003
        id: 3
    }
}

相关内容