NFS 服务器 - Corosync、DRBD 和 Pacemaker

NFS 服务器 - Corosync、DRBD 和 Pacemaker

我有 2 个 HA NFS 服务器(带有 CoroSync、Pacemaker 和 DRBD 的 Ubuntu)。

一切都运行良好,只剩下一个小问题。

如果我终止 NFS,它会无缝地发生故障转移(太棒了!)

当被杀死的节点重新启动时,它会导致 NFS 共享断开 5-10 秒(大概是因为它重新加入集群)

有人见过这种情况吗?/有任何关于如何解决这个问题的想法,以便当它重新加入集群时体验无缝。

答案1

尝试将“wait_for_leasetime_on_stop”设置为“true”。

答案2

这听起来像 Pacemaker 正在执行恢复,可能是在被杀死的节点重新加入后发现该服务在两个节点上都在运行。

/var/log/syslog如果您看到来自该进程的消息pengine提到类似“在 2 个节点上活动尝试恢复”的内容,您应该确保已nfs-server在两个节点上禁用 via systemd:

systemctl disable nfs-server

请务必检查两个节点上的日志。

相关内容