如何诊断大量 TIME_WAIT 连接

Question 1

简短回答 - 这是由于应用程序造成的。应用程序在短时间内创建套接字，然后关闭它们，然后它立即需要打开另一个套接字。缓慢与进程用尽可用的套接字有关。

创建套接字时有选项 - SO_REUSEADDR 和 SO_REUSEPORT。它们具有类似的功能，但我怀疑在 Centos 5 中 SO_REUSEPORT 不可用。无论如何，套接字调用上的可选设置允许立即重用端口。

因此，常用的修复方法是重新编码。它可能是一个连接几秒钟然后结束会话的网络应用程序。

Answer

简短回答 - 这是由于应用程序造成的。应用程序在短时间内创建套接字，然后关闭它们，然后它立即需要打开另一个套接字。缓慢与进程用尽可用的套接字有关。

创建套接字时有选项 - SO_REUSEADDR 和 SO_REUSEPORT。它们具有类似的功能，但我怀疑在 Centos 5 中 SO_REUSEPORT 不可用。无论如何，套接字调用上的可选设置允许立即重用端口。

因此，常用的修复方法是重新编码。它可能是一个连接几秒钟然后结束会话的网络应用程序。

Question 2

它为套接字设置属性，然后由内核允许/强制执行这些属性。

简短的回答 - 是的，是的。因此，如果您使用慢速 DSL 与偏远办公室建立非常慢的连接，则可能存在“迟缓”数据包的问题。但如果这些是 LAN 中的连接，则可能不存在问题。
您的某个应用程序必须批量打开套接字，然后关闭它们。 lsof 将显示哪个 pid 打开了套接字。从那里您可以获得用户和正在运行的内容。例如，它可以是像滥用 netcat 的 bash shell 脚本一样简单的东西。

底线：这要么是网络设施滥用，要么是代码问题。而且您确实有一个网络应用程序 - 这个应用程序正在吞噬您的系统。我对网络应用程序的定义是“使用 TCP/UDP 套接字”。不一定是 Web 服务器。

Answer

它为套接字设置属性，然后由内核允许/强制执行这些属性。

简短的回答 - 是的，是的。因此，如果您使用慢速 DSL 与偏远办公室建立非常慢的连接，则可能存在“迟缓”数据包的问题。但如果这些是 LAN 中的连接，则可能不存在问题。
您的某个应用程序必须批量打开套接字，然后关闭它们。 lsof 将显示哪个 pid 打开了套接字。从那里您可以获得用户和正在运行的内容。例如，它可以是像滥用 netcat 的 bash shell 脚本一样简单的东西。

底线：这要么是网络设施滥用，要么是代码问题。而且您确实有一个网络应用程序 - 这个应用程序正在吞噬您的系统。我对网络应用程序的定义是“使用 TCP/UDP 套接字”。不一定是 Web 服务器。

相关内容