Oracle Linux 5:21% 的接收数据包丢失

Oracle Linux 5:21% 的接收数据包丢失

这就是我所看到的:

# netstat -i

Kernel Interface table
Iface       MTU Met    RX-OK RX-ERR RX-DRP RX-OVR    TX-OK TX-ERR TX-DRP TX-OVR Flg
bond0      1500   0   703449      0 147463      0   978099      0      0      0 BMmRU
eth4       1500   0   306302      0      0      0   259244      0      0      0 BMsRU
eth5       1500   0   397147      0      6      0   718855      0      0      0 BMsRU
lo        16436   0  1977704      0      0      0  1977704      0      0      0 LRU


# cat /proc/net/bonding/bond0

Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)

Bonding Mode: IEEE 802.3ad Dynamic link aggregation
Transmit Hash Policy: layer3+4 (1)
MII Status: up
MII Polling Interval (ms): 100
Up Delay (ms): 5000
Down Delay (ms): 5000

802.3ad info
LACP rate: fast
Aggregator selection policy (ad_select): stable
Active Aggregator Info:
       Aggregator ID: 1
       Number of ports: 2
       Actor Key: 17
       Partner Key: 32912
       Partner Mac Address: RE:DA:CT:ED:be:05

Slave Interface: eth4
MII Status: up
Speed: 1000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: RE:DA:CT:ED:1a:da
Aggregator ID: 1
Slave queue ID: 0

Slave Interface: eth5
MII Status: up
Speed: 1000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: RE:DA:CT:ED:1a:db
Aggregator ID: 1
Slave queue ID: 0

21% 的丢包相当于 DOS 攻击。 (我的调查还不够深入,无法对“故意”和/或“恶意”发表意见。)该债券由eth4和组成eth5。主机上没有其他接口处于活动状态。

这不是什么:

  • 该主机上没有运行防火墙。这不是由于内部防火墙导致的数据包丢失。
  • cat /proc/net/bonding/bond0显示没有错误
  • ethtool -S <iface>显示没有错误,但只有各个接口的结果;整个债券没有任何内容。
  • 网络团队表示交换机正在将该主机的 IP 地址与绑定 MAC 地址进行匹配,并且两个值都是正确的。

限制:

  • 该网络由不同的团队运营。我无法直接访问交换机。

问题:

  • 什么会导致绑定丢包?
    • 为什么绑定显示数据包丢失,而不是各个接口?
  • 我可以向网络团队传递哪些思科交换机建议来帮助缩小范围?
  • 如果我在绑定上启动 a ,它是否会看到数据包被丢弃,或者丢弃是否发生在其记录tcpdump点之前?tcpdump

  • 我找到了参考水滴表,并安装并运行它。唯一的滴是这样的形式

    irq_stack_union+0 处丢弃 0 -1 处 __per_cpu_end+fffee201 处丢弃 -1 处 __per_cpu_end+fffee202 处丢弃

现在就来研究一下。

  • 中断平衡显示了一大堆信息,但没有一个是灌篮高手。但是,守护进程正在主机上运行。

这个红帽解决方案提到“Softnet 备份完整”。其他解决方案添加“测量/proc/net/softnet_stat”。到目前为止,没有任何解决方案详细说明这意味着什么。如何具体识别“Softnet Backup Full”是否是这些数据包丢失的来源?

答案1

事实证明,这是“按设计工作的”。看https://access.redhat.com/solutions/657483

相关内容