nginx 反向代理大大增加了最坏情况下的延迟

Question 1

第一次运行中 3 秒的最坏情况ab看起来像是数据包丢失。这可能是由于配置的缓冲区/资源不足造成的，以下是一些可能的原因（无特定顺序）：

后端的监听队列太小，导致偶尔的监听队列溢出（在这种情况下，Linux 通常配置为仅丢弃 SYN 数据包，因此无法区分是数据包丢失；查看netstat -s | grep listen是否是问题所在）。
本地主机上的状态防火墙接近其状态数量的限制，并因此丢弃一些随机 SYN 数据包。
由于套接字处于 TIME_WAIT 状态，系统没有套接字/本地端口，请参阅这个问题如果您使用的是 Linux。

您必须仔细检查操作系统以找出原因并相应地配置操作系统。您可能还需要遵循一些针对操作系统的网络子系统调优指南。请注意，EC2 在这里可能有点具体，因为有报告称 EC2 实例上的网络性能非常有限。

从 nginx 的角度来看，任何解决方案或多或少都是错误的（因为问题不在于 nginx，而在于无法应对负载并丢弃数据包的操作系统）。不过，您可以尝试一些技巧来减少操作系统网络子系统的负载：

配置保持与后端的连接。
配置后端来监听 unix 域套接字（如果您的后端支持它），并配置 nginx 来代理对它的请求。

Answer

第一次运行中 3 秒的最坏情况ab看起来像是数据包丢失。这可能是由于配置的缓冲区/资源不足造成的，以下是一些可能的原因（无特定顺序）：

后端的监听队列太小，导致偶尔的监听队列溢出（在这种情况下，Linux 通常配置为仅丢弃 SYN 数据包，因此无法区分是数据包丢失；查看netstat -s | grep listen是否是问题所在）。
本地主机上的状态防火墙接近其状态数量的限制，并因此丢弃一些随机 SYN 数据包。
由于套接字处于 TIME_WAIT 状态，系统没有套接字/本地端口，请参阅这个问题如果您使用的是 Linux。

您必须仔细检查操作系统以找出原因并相应地配置操作系统。您可能还需要遵循一些针对操作系统的网络子系统调优指南。请注意，EC2 在这里可能有点具体，因为有报告称 EC2 实例上的网络性能非常有限。

从 nginx 的角度来看，任何解决方案或多或少都是错误的（因为问题不在于 nginx，而在于无法应对负载并丢弃数据包的操作系统）。不过，您可以尝试一些技巧来减少操作系统网络子系统的负载：

配置保持与后端的连接。
配置后端来监听 unix 域套接字（如果您的后端支持它），并配置 nginx 来代理对它的请求。

Question 2

NGINX 使用 HTTP/1.0 进行后端连接，默认情况下没有 keepalive（请参阅 Maxim 文章中有关后端 keepalive 的链接），因此这意味着为每个请求建立一个新的后端连接，这会稍微增加延迟。您可能还应该有更多工作进程，2* CPU 核心数，至少 5 个。如果您有超过 10 个并发请求，您可能还需要 CherryPy 中的更多线程。

Answer

NGINX 使用 HTTP/1.0 进行后端连接，默认情况下没有 keepalive（请参阅 Maxim 文章中有关后端 keepalive 的链接），因此这意味着为每个请求建立一个新的后端连接，这会稍微增加延迟。您可能还应该有更多工作进程，2* CPU 核心数，至少 5 个。如果您有超过 10 个并发请求，您可能还需要 CherryPy 中的更多线程。

nginx 反向代理大大增加了最坏情况下的延迟

答案1

答案2

相关内容