主从 Mysql 复制的自动故障转移策略--为什么它不起作用？

Question 1

自动故障转移不利的原因与复制滞后有关。如果从服务器恰好落后并且发生故障转移，则您可能正在使用尚不存在的键写入更新，因为主服务器的插入尚未写入。复制滞后越多，这个问题就越严重。在我的公司，我们使用 DRBD 进行自动故障转移，因为您故障转移到的 DRBD 服务器是原始主服务器的精确磁盘级副本。作为一项政策，我们手动进行主/从服务器和主/主设置的故障转移。

Answer

自动故障转移不利的原因与复制滞后有关。如果从服务器恰好落后并且发生故障转移，则您可能正在使用尚不存在的键写入更新，因为主服务器的插入尚未写入。复制滞后越多，这个问题就越严重。在我的公司，我们使用 DRBD 进行自动故障转移，因为您故障转移到的 DRBD 服务器是原始主服务器的精确磁盘级副本。作为一项政策，我们手动进行主/从服务器和主/主设置的故障转移。

Question 2

您想要的是一个高可用性集群，我认为您建议的方法似乎有点奇怪。

实现此目的的一个好方法是创建一个 Linux HA 集群并使用文件系统级别的 DRDB 同步来同步您的 MySQL。

在这样的设置中，你有 3 件事：

集群消息层（Linux-HA 或 CoroSync）
集群资源管理器 (Pacemaker)
磁盘同步（DRDB）

您无需在应用程序中编写大量代码，只需使用虚拟 IP 地址，然后将其移动到当前活动节点即可。此外，您还使用 STONITH（Shoot The Other Node In The Head（我没有编造））确保第一个节点在尝试接管资源之前确实已死。

这些链接上有一些很棒的材料可供阅读： http://www.linux-ha.org/wiki/Main_Page http://www.clusterlabs.org/wiki/DRBD_MySQL_HowTo http://theclusterguy.clusterlabs.org/

Answer