使用多个 Nginx 负载均衡器进行 DNS 故障转移

Question

我喜欢这种方法，这是我最喜欢的，如果你来旧金山，我会请你喝杯啤酒！

两个答案，首先针对你的 502 问题，你应该将其添加到你的 nginx，因此如果至少有一些有能力的节点，nginx 将重试（默认情况下，在 502 上它会放弃）：

http://wiki.nginx.org/HttpProxyModule#proxy_next_upstream

proxy_next_upstream 

syntax: proxy_next_upstream [error|timeout|invalid_header|http_500|http_502|http_503|http_504|http_404|off];

其次，对于“返回 DNS”，您需要稍微改变方法。对于这些设置，我通常会将 DNS 拉回到应用程序节点本身，以测试通过负载平衡器到终端节点的连通性。作为额外奖励，您可以将 DNS 与您的应用程序集成，并在应用程序死机时关闭 DNS 服务器。这里的想法是让客户端 DNS 请求“测试”整个路径是否正常工作，而不仅仅是与 LB 的连接。显然您不能为此使用 NGINX，我为此使用了 pf 规则，您可以在 iptables 中执行相同操作。您只需将请求轮询到后端节点并在后端服务器上运行绑定。然后，这个想法是确保您有多个 NS 条目，每个“LB”一个。客户端将负责测试每个 NS 记录，在我进行的测试中，平均故障转移时间为 2 秒，并且它适用于我们查看的 99% 的操作系统。让我知道这是否有意义。它将比客户端已经发出第一个 TCP 请求后尝试恢复的任何场景效果更好。

根据 Gomez 和 Keynote 的监控，使用此解决方案我建立的网站保持了 100% 的可用性。正如您之前提到的，它可能会导致 DNS 查找的一些初始性能损失，但网站始终可以正常工作，客户对此非常满意（我的寻呼机也是如此）。

Answer 1

我喜欢这种方法，这是我最喜欢的，如果你来旧金山，我会请你喝杯啤酒！

两个答案，首先针对你的 502 问题，你应该将其添加到你的 nginx，因此如果至少有一些有能力的节点，nginx 将重试（默认情况下，在 502 上它会放弃）：

http://wiki.nginx.org/HttpProxyModule#proxy_next_upstream

proxy_next_upstream 

syntax: proxy_next_upstream [error|timeout|invalid_header|http_500|http_502|http_503|http_504|http_404|off];

其次，对于“返回 DNS”，您需要稍微改变方法。对于这些设置，我通常会将 DNS 拉回到应用程序节点本身，以测试通过负载平衡器到终端节点的连通性。作为额外奖励，您可以将 DNS 与您的应用程序集成，并在应用程序死机时关闭 DNS 服务器。这里的想法是让客户端 DNS 请求“测试”整个路径是否正常工作，而不仅仅是与 LB 的连接。显然您不能为此使用 NGINX，我为此使用了 pf 规则，您可以在 iptables 中执行相同操作。您只需将请求轮询到后端节点并在后端服务器上运行绑定。然后，这个想法是确保您有多个 NS 条目，每个“LB”一个。客户端将负责测试每个 NS 记录，在我进行的测试中，平均故障转移时间为 2 秒，并且它适用于我们查看的 99% 的操作系统。让我知道这是否有意义。它将比客户端已经发出第一个 TCP 请求后尝试恢复的任何场景效果更好。

根据 Gomez 和 Keynote 的监控，使用此解决方案我建立的网站保持了 100% 的可用性。正如您之前提到的，它可能会导致 DNS 查找的一些初始性能损失，但网站始终可以正常工作，客户对此非常满意（我的寻呼机也是如此）。

使用多个 Nginx 负载均衡器进行 DNS 故障转移

答案1

相关内容