Linux 上的 GRE 性能问题

Linux 上的 GRE 性能问题

我遇到了一个奇怪的 GRE 性能问题。

设置如下所示。

[主机 1] --- GRE 通过 Eth 1G --- [linux 路由器] --- Eth 10G --- [主机 2]

Iperf 的传输速率 host1>host2 达到 950Mbps,随着左边几台主机并行运行,传输速率线性增加,最高可达几 Gbps。

但是对于host2>host1方向,iperf的传输速率在单次和多次并行测试中都被限制在~400Mbps。

值得注意的是:

  1. 观察到的 TCP 窗口大小低于 64K,重传率非常低。

  2. 10G 链路上路由器以 ethertype=0x0011 发出大量数据包。我猜想这是某种类型的背压。

我怀疑 GRE 路由堆栈使用非常小的内部共享缓冲区(64K),但我找不到任何有用的信息。

我将非常感激任何关于如何解决该问题的建议。

我在路由器上使用Centos 7(内核3.10.0-693)。

==

[wk@host2 ~]$ iperf3 -c host1 -t 100
Connecting to host host1, port 5201
[  4] local host1 port 33930 connected to host2 port 5201
[ ID] Interval           Transfer     Bandwidth       Retr  Cwnd
[  4]   0.00-1.00   sec  79.7 MBytes   668 Mbits/sec   10   62.8 KBytes
[  4]   1.00-2.00   sec  68.9 MBytes   578 Mbits/sec    1   5.46 KBytes
[  4]   2.00-3.00   sec  43.7 MBytes   366 Mbits/sec    5   21.8 KBytes
[  4]   3.00-4.00   sec  49.4 MBytes   414 Mbits/sec    2   28.7 KBytes
[  4]   4.00-5.00   sec  52.6 MBytes   442 Mbits/sec    1   43.7 KBytes


reading from file out.pcap, link-type LINUX_SLL (Linux cooked)
13:08:37.355114 IP host2.33197 > host1.5201: Flags [S], seq 3986495932, win 14600, options [mss 1460,sackOK,TS val 3358395421 ecr 0,nop,wscale 9], length 0
13:08:37.355120 Out 3c:fd:fe:9c:e4:20 ethertype Unknown (0x0011), length 80:
        0x0000:  0000 0800 4500 003c 15a1 4000 4006 9d18  ....E..<..@.@...
13:08:37.355642  In 00:1b:21:bc:5d:96 ethertype Unknown (0x0011), length 80:
        0x0000:  0000 0800 4500 003c 0000 4000 3f06 b3b9  ....E..<..@.?...
13:08:37.355642 IP host1.5201 > host2.33197: Flags [S.], seq 1075451774, ack 3986495933, win 13980, options [mss 1410,sackOK,TS val 3173856449 ecr 3358395421,nop,wscale 8], length 0
13:08:37.355675 IP host2.33197 > host1.5201: Flags [.], ack 1, win 29, options [nop,nop,TS val 3358395421 ecr 3173856449], length 0
13:08:37.355678 Out 3c:fd:fe:9c:e4:20 ethertype Unknown (0x0011), length 72:
        0x0000:  0000 0800 4500 0034 15a2 4000 4006 9d1f  ....E..4..@.@...
        0x0010:  c1e8 0218 c1e8 021a 81ad 1451 ed9d 19bd  ...........Q....
13:08:37.355720 IP host2.33197 > host1.5201: Flags [P.], seq 1:38, ack 1, win 29, options [nop,nop,TS val 3358395421 ecr 3173856449], length 37
13:08:37.355725 Out 3c:fd:fe:9c:e4:20 ethertype Unknown (0x0011), length 109:
        0x0000:  0000 0800 4500 0059 15a3 4000 4006 9cf9  ....E..Y..@.@...
        0x0010:  c1e8 0218 c1e8 021a 81ad 1451 ed9d 19bd  ...........Q....

答案1

抱歉,这是我的错。

对 host2 的输出应用了陈旧流量控制 400Mbps 限制。

[root@host2 ~]# tc class show dev eth2.17
class htb 1:1 root prio 0 rate 400000Kbit ceil 400000Kbit burst 125Kb cburst 125Kb

相关内容