如何优化 Linux NAT/路由器的吞吐量？

2024-5-30 • tag-icon

我正在尝试使用一台旧的 Fujitsi RX300S2，配备四核 Intel Xeon CPU @2.80GHz 作为 Gitabit NAT 路由器，它有一个通过 PCI-X 连接的双千兆 NIC。

路由器还会将多播流量从外部接口转发到内部网络。多播路由由上游 Cisco 路由器处理，因此 NAT 路由器只需在 eth1（上游）和 eth0（内部）之间“泄露”多播流量。

这已使用 igmpproxy 正确设置，它基本上使 L3 路由器根据多播流量充当 L2 桥。

在测试吞吐量时，我可以轻松接收 200 个组/流（约 80'000 p/s）上的 ~850-900Mbit 多播流量到用户空间中的本地进程，该进程还可以实时分析 200 个流而不会丢失数据包。本地进程将一个核心的最大利用率设为 100%。

该流由封装在 IP UDP 数据包中的 IPTV mpeg 传输流组成。7x188=1316 字节的有效负载。

但是在转发模式下测试吞吐量时，例如多播流量进入 eth1 并在内核级路由到 eth0 并发送到本地网络，NAT 路由器无法转发所有接收到的流量。

外部接口 eth1 接收所有多播流量~900Mbit，但传出接口仅传输~600Mbit，并且根据连接到 eth0 的接收测试机器，所有流都遭受数据包丢失。

当分析负载时，ksoftirqd/3 的最大 CPU 利用率为 100%，但其他 3 个核心的 CPU 利用率低于 10%，因此似乎并非所有 4 个核心都参与了负载。

/proc/interrupts 还显示 eth0 和 eth1 共享 irq16：

    CPU0 CPU1  CPU2       CPU3
16:    0    0 92155  208280892   IO-APIC   16-fasteoi uhci_hcd:usb2, uhci_hcd:usb5, eth1, eth0

可以看出，CPU3 处理了过多的中断。

我阅读了有关 cpu_affinity 的各种文章，并尝试将 CPU 核心固定到网络队列。不幸的是，这款 Broadcom 的 NIC tg3 不支持多个队列，但仍然应该可以在这个四核系统上的更多核心之间共享负载。

或者是 PCI-X 总线是瓶颈，但如果是这样，那么传入 eth1 和传出 eth0 的吞吐量都应该减少，并且数据包应该被丢弃eth1，但似乎 eth1 和 eth0 之间数据包丢失了。事实并非如此，因为当数据包在路由器中丢失时，/sys/class/net/eth1/statistics/rx_missed_errors 会大量增加（大约 1000 p/s）。

当只有 100 个通道和大约 500 Mbit 被转发时，不会发生数据包丢失，并且 ksoftirqd/3 仅消耗大约 5-6% 的 CPU。但是当转发 600Mbit 时，ksoftirqd/3 消耗 100%，因此似乎遇到了 CPU 之外的一些瓶颈。

像这样的旧服务器是否只能在两个内置 NIC 之间单向转发 1Gbit 的 UDP 流量？即使数据包很大，有效载荷为 1316 字节，在 1Gbit 中也能达到中等的 80..90kp/s？

答案1

我们放弃了这台服务器，因为根据规格，两个板载网络接口不应该承载全千兆流量。第二个接口用于管理。

配备 PCIe 和两个 Intel i210 千兆适配器的标准台式机酷睿 i5 能够毫无问题地转发 1Gbit 多播 UDP 流量。

不过，由于流量突发，它需要调整 RX 和 TX 缓冲区 (ethtool -G)。2x 或 4x PCIe 可能有助于降低 PCIe 总线拥塞导致丢失数据包的风险。

答案1

相关内容