如何通过 MySQL 复制或集群来设置故障转移场景？

Question

您提出了两个问题。

MySQL 拓扑按顺序（从 OK 到 Best）

主服务器 -> 副本服务器——可以实现“故障转移”，但需要手动操作，因此需要时间。
主服务器 <=> 主服务器——设置起来仅稍微复杂一些，同时提供对另一台服务器的“即时”使用。
至少包含 3 个服务器的集群。这进一步实现了故障转移的自动化。请参阅“InnoDB CLuster”（MySQL 8）或“Galera”（包含在 MariaDB 中）。

地理位置——请注意，即使是数据中心也可能出现故障。例如，佛罗里达州有多少地方会因为一场飓风而下线？

请注意“裂脑”场景。在这种情况下，您只有两台服务器，并且两台服务器都运行良好，但网络瘫痪了。它们无法分辨，您也无法判断情况如何。如果每台服务器都认为自己是唯一活着的服务器并继续进行写入，那么您最终会陷入混乱。因此，您必须假设整个系统都瘫痪了。

底线——您至少需要 3 台物理上分开的服务器。

代理人

仍然存在问题客户知道数据库系统的哪个部分处于活动状态（用于读取和/或写入）。当只有“读取”很重要时，许多具有任意数量副本的拓扑就足够了——并提供“无限”扩展。“写入”才是真正的挑战所在。

有几种第三方产品可以很好地发现一台服务器宕机，并“采取正确的措施”将服务器重新路由到其他服务器。研究一下它们。

编码

当发生故障时，您的代码可能会出现某种错误。您必须检查错误，有些错误无法自行修复。而且大多数网络错误需要一段时间才能被注意到。

Answer 1