NGINX 为何超时?

NGINX 为何超时?

我有一个拥有大约 20 万名用户的应用程序,并且在 AWS EC2 负载均衡器后面运行 NGINX + Gunicorn(Python)服务器。

我不明白为什么我的请求数总是 4k/分钟,但有时只有一半的流量是超时问题。大多数时候所有请求都正常,但有时它开始锁定,然后几乎所有请求都会超时。

我注意到当前连接数的这种模式呈波浪形,从 1000 到 0 波动。NGINX 是否以某种方式捆绑请求?我如何区分 request_time 以确定是 NGINX 配置不正确,还是我的 Python 服务器只是过于频繁地调用了非常慢的端点。

我附加了 NGINX Amplify 仪表板中其中一台服务器的屏幕截图。

有没有关于 NGINX 日志或 Amplify 的部分内容,我可以调查一下以确定这是否是 NGINX 配置问题,或者托管的 Python 进程是否被锁定了?谢谢! NGINX Amplify 仪表板

答案1

查看您的 CloudWatch 指标,尤其是有关“丢弃”或“失败”的指标。您可以在那里看到有关负载均衡器和 EC2 实例的所有详细信息。我不知道您使用的实例类型是什么,但可能是您不断过度使用 T2/T3 实例并耗尽信用。我认为您的某些部分流量由于某种原因受到限制,而这不一定是实例本身的问题。

相关内容