我在带有负载均衡器的 EC2 上托管了多个节点 Web 服务器,有些用户甚至在请求到达服务器之前就收到了 502 错误。
我没有服务器内部这些请求的日志,这就是为什么我假设该请求永远不会到达服务器。
我之前遇到过类似的问题,我不得不在节点配置中添加keepAliveTimeout
和。headersTimeout
我每天白天都会遇到几个不健康的实例,但发生这种情况的时间并不总是与 502 错误的时间相匹配。我是否应该将健康检查超时时间从 5 秒增加到 10 秒,看看会发生什么?
内存和 CPU 使用率似乎很好。
关于如何调试此问题有什么提示吗?
答案1
您已经知道答案:不健康的实例。即使时间不匹配,您也应该解决该问题并检查其他问题是否仍然存在。
增加实例大小,增加 ELB 健康检查超时,扩大机器规模并检查是否有帮助