链路聚合对我来说不起作用,以至于服务器无法访问:可能是什么问题,以及这种类型(看似相当常见的)设置的最佳做法是什么?
配备双 10Gb NIC 的 Dell r730 运行 Ubuntu 22.04(Ubuntu 22.04.3 LTS(GNU/Linux 5.15.0-82-generic x86_64))并为 VMware 集群提供 iSCSI 目标。
这些 NIC 连接到两个不同的(但互连 - “堆叠”是正确的词)Meraki MS225 交换机上的 10Gb 链路聚合端口。
在 Ubuntu 中,NIC 是“绑定的”:
renderer: networkd
ethernets:
enp130s0f0:
dhcp4: no
enp130s0f1:
dhcp4: no
bonds:
bond-00:
interfaces: [enp130s0f0,enp130s0f1]
addresses: [<IPv4>/24]
dhcp4: no
routes:
- to: default
via: <gateway_IP>
metric: 100
nameservers:
addresses: [<ns01_IP>,<ns02_IP>]
search: [localdom.local]
parameters:
mode: balance-xor
mii-monitor-interval: 1
如果 Meraki 交换机上的端口不是链路聚合 - 一切都很好,只是与仅使用一个 10Gb NIC 相比,速度稍慢一些(~40%)。(我希望“绑定”NIC 然后在 Meraki 中配置链路聚合,可以让我们的网速比单个 NIC 快一点。)
但是,如果 Meraki 交换机上的端口是链路聚合 - 数据包丢失率 >50%,并且服务器变得(几乎)无响应。
(VMware 中无需特殊配置。ESXi 7.0u3,10Gb 链路是主动-主动的,除此之外都是默认的。无法在 VMware 中配置 iSCSI 网络端口绑定,因为 10Gb NIC 用于一般流量,而不仅仅是 iSCSI。)
我究竟做错了什么?
我尝试过的配置:
- Meraki:无需特殊配置,无链路聚合
- Ubuntu:没有链路绑定,只有两个单独配置的 NIC,每个 NIC 都有自己的 IP:没有问题,带宽~10Gbps,即使使用 iSCSI 多路径也只使用一个链路。
- Ubuntu:“balance-rr”、“balance-xor”、“802.3ad”、“balance-alb”模式下的绑定链接:~6Gbps(慢 40%),两个链接均使用,在 Meraki 中未看到任何错误。
- 梅拉基:启用链路聚合
- >50% 的数据包丢失,并且通常无法使用 - 无论 Ubuntu 中的绑定模式如何(尝试过“balance-rr”、“balance-xor”、“802.3ad”)。(没有尝试不使用绑定 - 因为它违背了目的。)
(我认为下一步是禁用 Meraki 中的 LACP,然后返回 Ubuntu 中没有绑定的单个 NIC。)
谢谢!