为什么 CentOS 服务器中 /proc/net/udp 显示错误的 rx_queue 大小？

Question 1

我在 Ubuntu 18.04 LTS（内核 4.15.0-38）上看到类似的问题。但在我的 Debian 9.5（内核 4.9.110-3）机器上却没有发生这种情况。似乎是较新内核中的错误？

重现该问题的一个简单方法是使用 netcat。客户端和服务器可以位于本地或位于不同的机器上。

在一个终端中运行 netcat 服务器： nc -u -l 1234
在另一个终端中运行netcat客户端：nc -u 127.0.0.1 1234
在客户端中输入短信“a”并按回车键。
在第三个终端中检查recv-q长度：netstat -plan |正则表达式 1234

在 Ubuntu 上，即使 netcat 已从套接字读取消息并打印它，接收 udp 套接字也将具有非空的 recv-q（2 字节消息为 768 字节）。我发现 recv-q 一直增长到大约 52k，然后它重置回零。

在 Debian 上，只要 udp 套接字耗尽的速度快于接收数据包的速度，recv-q 就始终为零。

还发现了这个内核错误报告：/proc/net/udp 中的 UDP rx_queue 计算不正确

Answer

我在 Ubuntu 18.04 LTS（内核 4.15.0-38）上看到类似的问题。但在我的 Debian 9.5（内核 4.9.110-3）机器上却没有发生这种情况。似乎是较新内核中的错误？

重现该问题的一个简单方法是使用 netcat。客户端和服务器可以位于本地或位于不同的机器上。

在一个终端中运行 netcat 服务器： nc -u -l 1234
在另一个终端中运行netcat客户端：nc -u 127.0.0.1 1234
在客户端中输入短信“a”并按回车键。
在第三个终端中检查recv-q长度：netstat -plan |正则表达式 1234

在 Ubuntu 上，即使 netcat 已从套接字读取消息并打印它，接收 udp 套接字也将具有非空的 recv-q（2 字节消息为 768 字节）。我发现 recv-q 一直增长到大约 52k，然后它重置回零。

在 Debian 上，只要 udp 套接字耗尽的速度快于接收数据包的速度，recv-q 就始终为零。

还发现了这个内核错误报告：/proc/net/udp 中的 UDP rx_queue 计算不正确

Question 2

请原谅我对 StackExchange 的这一部分不熟悉，所以我发布的是答案而不是评论。

Ubuntu 18.04 LTS我在（kernel ）上遇到了与@Neopallium相同的问题4.15.0-36。从我的测试来看，人为设置net.core.rmem_max=26214400和net.core.rmem_default=26214400（分别25MB）并运行我的 UDP 服务器应用程序，在整个测试过程中没有 UDP 数据报积压，我看到计数器rx_queue上升到大约00000000:006xxxxx或~6MB+，然后计数器突然重置为0。这大约是计数器重置之前1/4的时间。net.core.rmem_max在和的Ubuntu 18.04 LTS默认值上，因此@Neopallium 看到他的计数器在重置之前上升到大约（大约）也就不足为奇了。net.core.rmem_defaultnet.core.rmem_max21299252k1/4212k

/proc/net/udp以下是接近重置点时应用程序的输出：

 sl  local_address rem_address   st tx_queue rx_queue tr tm->when retrnsmt   uid  timeout inode ref pointer drops
 1256: 00000000:7530 00000000:0000 07 00000000:00632240 00:00000000 00000000     0        0 94457826 2 0000000000000000 0

这是过去 45 分钟内我的 grafana 套接字图的屏幕截图：

就像@Neopallium 我倾向于相信这是一个内核错误。

Answer