多个网关之间的故障转移

多个网关之间的故障转移

我有一个正在运行的 CentOS 服务器中心(类似于 Nagios 的监控解决方案)用于监控多个网络中的设备。服务器可以通过 4 个不同的网关/路由器访问互联网,每个网关/路由器都有自己的物理互联网连接(ADSL 和/或 LTE)。

现在我已将其中一个设置为网关,如果这条线路出现故障,服务器就无法再访问互联网。如果一个网关出现故障,如何自动切换到另一个网关?

这也引发了一个问题:我如何检测互联网连接是否失败?

  • 对路由器执行 ping 操作只能检测服务器和路由器之间的故障
  • 通过 SNMP 检查是否考虑了 DSLup会导致许多误报。因为 DSL 不知何故已启动/同步,但问题似乎出在提供商方面。
  • 如果该主机发生故障,则在互联网上 ping 该主机可能会导致误报。另外:我应该 ping 哪个主机?
    • Google DNS(8.8.8.8 和 8.8.4.4)有时可能会失败
    • 提供商的 DNS 服务器会不时更改
    • 路由器后的第一跳:有时也会改变
  • 对其他网关进行 ping 也会导致误报

下一个问题是:我如何检查其他三个连接中哪一个仍在工作?

答案1

实际上,你的问题包含两部分。

第一,如何保证你的服务器和路由器之间的高可用性。第二,如何保证你的路由器和互联网之间的高可用性。

对于第一个问题,您需要两个物理企业路由器。有专门用于此目的的协议,例如 HSRP、VRRP、GLBP。

对于第二个问题,我建议你跟踪 www.google.com。通常这个网站应该一直可用。

相关内容