这就是我所看到的:
# netstat -i
Kernel Interface table
Iface MTU Met RX-OK RX-ERR RX-DRP RX-OVR TX-OK TX-ERR TX-DRP TX-OVR Flg
bond0 1500 0 703449 0 147463 0 978099 0 0 0 BMmRU
eth4 1500 0 306302 0 0 0 259244 0 0 0 BMsRU
eth5 1500 0 397147 0 6 0 718855 0 0 0 BMsRU
lo 16436 0 1977704 0 0 0 1977704 0 0 0 LRU
# cat /proc/net/bonding/bond0
Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)
Bonding Mode: IEEE 802.3ad Dynamic link aggregation
Transmit Hash Policy: layer3+4 (1)
MII Status: up
MII Polling Interval (ms): 100
Up Delay (ms): 5000
Down Delay (ms): 5000
802.3ad info
LACP rate: fast
Aggregator selection policy (ad_select): stable
Active Aggregator Info:
Aggregator ID: 1
Number of ports: 2
Actor Key: 17
Partner Key: 32912
Partner Mac Address: RE:DA:CT:ED:be:05
Slave Interface: eth4
MII Status: up
Speed: 1000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: RE:DA:CT:ED:1a:da
Aggregator ID: 1
Slave queue ID: 0
Slave Interface: eth5
MII Status: up
Speed: 1000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: RE:DA:CT:ED:1a:db
Aggregator ID: 1
Slave queue ID: 0
21% 的丢包相当于 DOS 攻击。 (我的调查还不够深入,无法对“故意”和/或“恶意”发表意见。)该债券由eth4
和组成eth5
。主机上没有其他接口处于活动状态。
这不是什么:
- 该主机上没有运行防火墙。这不是由于内部防火墙导致的数据包丢失。
cat /proc/net/bonding/bond0
显示没有错误ethtool -S <iface>
显示没有错误,但只有各个接口的结果;整个债券没有任何内容。- 网络团队表示交换机正在将该主机的 IP 地址与绑定 MAC 地址进行匹配,并且两个值都是正确的。
限制:
- 该网络由不同的团队运营。我无法直接访问交换机。
问题:
- 什么会导致绑定丢包?
- 为什么绑定显示数据包丢失,而不是各个接口?
- 我可以向网络团队传递哪些思科交换机建议来帮助缩小范围?
如果我在绑定上启动 a ,它是否会看到数据包被丢弃,或者丢弃是否发生在其记录
tcpdump
点之前?tcpdump
我找到了参考水滴表,并安装并运行它。唯一的滴是这样的形式
irq_stack_union+0 处丢弃 0 -1 处 __per_cpu_end+fffee201 处丢弃 -1 处 __per_cpu_end+fffee202 处丢弃
现在就来研究一下。
- 中断平衡显示了一大堆信息,但没有一个是灌篮高手。但是,守护进程正在主机上运行。
这个红帽解决方案提到“Softnet 备份完整”。其他解决方案添加“测量/proc/net/softnet_stat
”。到目前为止,没有任何解决方案详细说明这意味着什么。如何具体识别“Softnet Backup Full”是否是这些数据包丢失的来源?
答案1
事实证明,这是“按设计工作的”。看https://access.redhat.com/solutions/657483