AWS ELB Apache2 503 服务不可用：后端服务器已满

Question 1

当 ELB 负载均衡器执行其运行状况检查并由于配置错误（通常是 NameVirtual 主机）而收到“页面未找到”（或其他简单错误）时，您将收到“后端服务器已满负荷”的信息。

尝试使用“ELB-HealthChecker”用户代理来 grep 日志文件文件夹。例如

grep ELB-HealthChecker  /var/log/httpd/*

这通常会导致 4 倍或 5 倍错误，但这些错误很容易修复。例如，Flooding、MaxClients 等给该问题带来了太多困扰。

仅供参考，亚马逊：为什么不显示请求返回的响应？即使是状态代码也会有帮助。

Answer

当 ELB 负载均衡器执行其运行状况检查并由于配置错误（通常是 NameVirtual 主机）而收到“页面未找到”（或其他简单错误）时，您将收到“后端服务器已满负荷”的信息。

尝试使用“ELB-HealthChecker”用户代理来 grep 日志文件文件夹。例如

grep ELB-HealthChecker  /var/log/httpd/*

这通常会导致 4 倍或 5 倍错误，但这些错误很容易修复。例如，Flooding、MaxClients 等给该问题带来了太多困扰。

仅供参考，亚马逊：为什么不显示请求返回的响应？即使是状态代码也会有帮助。

Question 2

我自己也遇到了这个问题。如果没有健康实例，Amazon ELB 将返回此错误。我们的站点配置错误，因此 ELB 健康检查失败，导致 ELB 使两台服务器无法轮换。由于没有健康站点，ELB 返回 503 服务不可用：后端服务器已满负荷。

Answer

我自己也遇到了这个问题。如果没有健康实例，Amazon ELB 将返回此错误。我们的站点配置错误，因此 ELB 健康检查失败，导致 ELB 使两台服务器无法轮换。由于没有健康站点，ELB 返回 503 服务不可用：后端服务器已满负荷。

Question 3

[更好地理解问题后进行编辑] 由于没有任何 ELB 经验，我仍然认为这听起来很像 Apache 前端 Tomcat 并淹没连接时可能抛出的 503 错误。

结果是，如果 Apache 发送的连接请求多于后端可以处理的数量，后端输入队列就会填满，直到无法再接受连接为止。当发生这种情况时，Apache 的相应输出队列也会开始填满。当队列已满时，Apache 会抛出 503。因此，当 Apache 是后端时，如果前端的发送速率足以填满队列，也会发生同样的情况。

（假设的）解决方案是确定后端的输入连接器和前端的输出连接器的大小。这变成了预期的洪水级别和相关计算机的可用 RAM 之间的平衡行为。

因此，当这种情况发生时，请检查您的 maxclients 设置并监控 Apache 中的繁忙工作进程 (mod_status)。如果可能，请对与 Tomcats 连接器积压、maxthreads 等相对应的 ELB 执行相同操作。简而言之，查看与 Apache 的输入队列和 ELB 的输出队列相关的所有内容。

虽然我完全理解它并不直接适用，但此链接包含 Apache 连接器的大小指南。您需要研究相应的 ELB 队列技术，然后进行计算： http://www.cubrid.org/blog/dev-platform/maxclients-in-apache-and-its-effect-on-tomcat-during-full-gc/

正如下面的评论中所述，流量激增并不是压垮 Apache 连接器的唯一可能。如果某些请求的处理速度比其他请求慢，那么这些请求的比例较高也会导致连接器队列填满。就我的情况而言，确实如此。

此外，当这种情况发生在我身上时，我很困惑，我必须重新启动 Apache 服务才能避免再次收到 503:s 服务。仅仅等待连接器泛洪是不够的。我从来没有弄清楚，但有人可以推测 Apache 可能从其缓存中提供服务？

在增加工作进程数和相应的预分叉最大客户端设置后（如果我没记错的话，这是 Windows 上的多线程 Apache，它还有其他几个队列指令），503 问题就消失了。我实际上没有做计算，只是调整了值，直到我能够观察到队列资源峰值消耗的较大幅度。我就放手了。

希望这能有所帮助。

Answer