所以我得到了:machine001,machine002,machine003。
machine001 有 2 个资源,machine002 有 1 个资源。通常它们不会运行在同一台主机上,除非 machine002 处于待机状态。
最近,我看到machine002出现了2次。1次在线,1次离线。
检查后sudo crm_mon -R
发现它们有不同的节点 ID。
我尝试删除节点 ID,但系统拒绝了。我尝试删除节点名称,但系统提示有一个同名的活动节点。
我进去sudo crm configure edit
后发现配置如下:
(111) machine001 \
standby=off
(222) machine002 \
standby=off
(333) machine003 \
standby=off
(12345) machine002
other_settings... \
因此,我删除了该行(12345) machine002
,保存并提交 CIB...并machine002
从输出中完全消失crm_mon
,并且输出似乎一直在尝试再次找到它...
恢复它的唯一方法是重新启动该节点上的 corosync 和 pacemaker。
我不知道这是怎么回事。有人能给我指明正确的方向吗?
编辑:请求的 corosync.conf 文件:
totem {
version: 2
cluster_name: debian
token: 3000
transport: udp
token_retransmits_before_loss_const: 10
join: 60
consensus: 3600
vsftype: none
max_messages: 20
clear_node_high_bit: yes
threads: 0
rrp_mode: none
crypto_cipher: none
crypto_hash: none
interface {
ringnumber: 0
bindnetaddr: 192.168.0.0
mcastaddr: 239.255.64.1
mcastport: 5405
ttl: 1
}
}
logging {
fileline: off
to_stderr: no
to_logfile: yes
logfile: /var/log/corosync/corosync.log
to_syslog: no
syslog_facility: daemon
debug: off
timestamp: on
logger_subsys {
subsys: QUORUM
debug: off
}
}
quorum {
expected_votes: 3
}
nodelist {
node {
ring0_addr: 192.168.0.25
name: machine001
id: 1
}
node {
ring0_addr: 192.168.0.26
name: machine002
id: 2
}
node {
ring0_addr: 192.168.0.27
name: machine003
id: 3
}
}