机架内第 2 层故障转移

机架内第 2 层故障转移

如何避免由于机架顶部交换机挂起/故障而导致的停机?可以在以下位置找到一些可能的解决方案推介会。

我感兴趣的是听听当需要自动故障转移时您如何处理这个问题。

编辑一些可能的选择:

  • 按照 womble 的建议,在每个服务器上运行生成树
  • 如上所述,以主动备份模式进行以太网绑定这里

答案1

对于需要这种级别保护的东西(风险/回报计算证明额外花费是合理的,因为发生概率很低——除非你买的是劣质交换机,否则它们不会经常发生故障),我只是对所有东西都进行双路径处理——两个交换机,一个连接到板载 NIC,另一个连接到板外 NIC(最好是不同的型号/制造商,以防止驱动程序/NIC 故障),然后边缘交换机连接到一对分发或核心交换机(视情况而定),然后连接到一对核心路由器,依此类推。一切都是重复的。

Bonding 配置为通过 ARP 测试链路,如果核心交换机发生故障(尽管所有交换机也都是交叉连接的),则切换到对中的另一个交换机。让生成树处理冗余,根据我的经验,这比这些幻灯片的作者建议的要强大得多。

答案2

在这种情况下,我会自己回答,因为 Womble 提出的在客户端运行 STP 的想法让我有点害怕。看起来:

  • 粘合在服务器和两个独立交换机之间定期检查连通性 [ arp_ip_target 参数 ]
  • 核心中/交换机之间的 RSTP

是最合理的解决方案。

答案3

我们根本不使用“机架顶部”交换机。我们要么使用内置交换机的刀片服务器,这些刀片服务器会中继回冗余分布或核心交换机,要么我们将服务器直接连接到冗余分布交换机(理想情况下运行 VSS)。

相关内容