帮助配置交换机以使 802.3ad 链路聚合正常工作

帮助配置交换机以使 802.3ad 链路聚合正常工作

我有一个交换机(SRW2024),它同时支持巨型帧和链路聚合。

我有 2 台服务器(每台都有 2x Gbit 网卡,在内核下工作),我想将它们连接到文件存储后端(iSCSI、openfiler)。

我已将每台服务器 (eth0+eth1) 的绑定设置为 bond0,并为其配置了子网。文件服务器也具有相同的网络。

网络上每个节点的绑定模式均为 4(802.3ad 动态链路聚合)。

但是,无法 ping 任何主机。

在 bond0 上使用 tcpdump,我收到一个 arp 请求“who has xx3.1 tell xx3.2”,但目标机器无法应答。

没有防火墙,没有特殊政策。

我花了几个小时尝试不同的配置...但没有成功。

我正在寻找某人来帮助我开始,但我迷失了。

任何帮助将非常感激。

答案1

Linksys 交换机的 Web 配置指南:

http://www.cisco.com/en/US/docs/switches/lan/csbms/srw2048/administration/guide/SRW-US_v10_UG_A-Web.pdf

第 25-26 页描述了在交换机端设置 LACP 的位置。确保在通向交换机的两个端口上设置了管理密钥。

抱歉,我无法提供更多帮助,我只处理过 Catalyst、ProCurve 和 Juniper EX 交换机等此类问题。

答案2

交换机支持 LACP 并不意味着它期待它。

确保在交换机端为适当的端口配置 LACP 组。

然后检查交换机和服务器的 LACP 状态。确保 802.3ad 链路已启动。

答案3

首先,您必须逐个排除每个 LAG 的故障。听起来您只是把所有东西都插上,而没有先使用一台服务器完成设置过程。否则,听起来您是在要求我们为您阅读手册。:-)

关于交换机配置:

在交换机上,您需要为每个单独的服务器创建单独的链路聚合组(或“bond”或“LAG”)。因此,如果您有服务器 #1 和服务器 #2,则需要在交换机上配置 LAG #1 和 LAG #2。

大多数“智能”交换机(Web 界面)都有一个单独的配置页面,用于将交换机端口分配给 LAG。命令行界面有所不同,但通常有一个专门用于处理此问题的配置子树。查看交换机手册——将有一章专门讨论此主题。

具体来说,您需要将每台服务器的真实(物理)交换机端口分配给该服务器的 LAG。如果服务器 #1 插入交换机端口 5 和 6,则您将交换机端口 5 和 6 分配给 LAG #1。服务器 #2 获得相同的处理,但其交换机端口分配给 LAG #2。

为每个 LAG 配置 LAG 特定参数。确保为每个 LAG/服务器对配置相同的 LACP 超时参数。通常,您希望使用“短”(1 秒)LACP 超时,但最重要的是两侧的设置相同。您还需要确保 LAG 类型正确:许多交换机支持多种链路聚合/绑定类型,主要是 Cisco 的 Portchannel 和 802.3ad。您必须为动态 802.3ad 操作配置 LAG,以匹配 Linux 机器的配置方式。

最后,您应该为每个 LAG 配置 VLAN、中继或其他端口特定参数。对于这些参数,您的交换机将把每个 LAG 视为另一个交换机端口 - 可以对其进行标记或中继,您可以打开巨型帧,可以过滤流量等。无论您为底层实际成员端口提供了什么设置,这些端口在分配给 LAG 时都会被忽略。

配置完 LAG 并指定其端口设置后,您应该能够通过交换机接口检查每个 LAG 的状态。它将报告某种链路状态,可能是整个绑定组的总体状态以及组中各个实际链路的状态。您可能会获得更多信息,具体取决于您的交换机接口。

在 Linux 服务器上,运行cat /proc/net/bonding/bond0(将“bond0”更改为您的 Bond 设备名称)以查看整个 Bond 和成员链路的状态。这将显示 Bond 和每个成员链路的一个节,如果 Bond 运行正常,则每个节都会有一行类似“MII Status: up”的内容。

答案4

LACP hello 超时错误。将超时设置为长(30 秒)。所有思科设备默认为长计时器。这是使用 nexus 设备的最佳实践,因为您可以进行无中断(在服务中)交换机升级。使用短 lacp 计时器对您没有任何好处

相关内容