对于给定的情况，您对软件负载平衡器或负载共享器有何建议？

Question 1

无论采用哪种解决方案，如果您安装了一个进程来转发流数据，它将需要每个连接缓冲区。这是因为您无法始终发送所有收到的内容，因此您必须将多余的内容保存在缓冲区中。也就是说，内存使用量将取决于并发连接数。一个大型站点正在愉快地运行 haproxy，默认设置为 150000 个并发连接（4 GB RAM）。如果您需要更多，版本 1.4 允许您调整缓冲区大小而无需重新编译。但是，请记住，每个套接字的内核缓冲区永远不会低于每个方向和每个套接字 4kB，因此每个连接至少 16 kB。这意味着让 haproxy 以每个缓冲区少于 8 kB 的内存运行是没有意义的，因为它消耗的内存已经少于内核的内存。

此外，如果您的服务是纯 TCP 且代理没有附加价值，请查看基于网络的解决方案，例如 LVS。它便宜得多，因为它处理数据包并且不需要维护缓冲区，因此套接字缓冲区在已满时会丢弃数据包，并且可以与服务安装在同一台机器上。

编辑: Javier，依赖操作系统进行负载平衡的预分叉进程根本无法很好地扩展。操作系统唤醒每一个当它获得连接时，所有进程都会启动，但只有其中一个进程会获得连接，而其他所有进程都会再次进入休眠状态。多进程模式下的 Haproxy 在 4 个进程左右时性能最佳。当进程数达到 8 个时，性能已经开始下降。Apache 对此使用了一个很好的技巧，它在 accept() 周围进行锁定，以便只有一个进程在等待接受。但这会破坏操作系统的负载平衡功能，并停止在 1000 到 2000 个进程之间进行扩展。它应该使用一些锁的数组，以便唤醒一些进程，但它没有这样做。

Answer

无论采用哪种解决方案，如果您安装了一个进程来转发流数据，它将需要每个连接缓冲区。这是因为您无法始终发送所有收到的内容，因此您必须将多余的内容保存在缓冲区中。也就是说，内存使用量将取决于并发连接数。一个大型站点正在愉快地运行 haproxy，默认设置为 150000 个并发连接（4 GB RAM）。如果您需要更多，版本 1.4 允许您调整缓冲区大小而无需重新编译。但是，请记住，每个套接字的内核缓冲区永远不会低于每个方向和每个套接字 4kB，因此每个连接至少 16 kB。这意味着让 haproxy 以每个缓冲区少于 8 kB 的内存运行是没有意义的，因为它消耗的内存已经少于内核的内存。

此外，如果您的服务是纯 TCP 且代理没有附加价值，请查看基于网络的解决方案，例如 LVS。它便宜得多，因为它处理数据包并且不需要维护缓冲区，因此套接字缓冲区在已满时会丢弃数据包，并且可以与服务安装在同一台机器上。

编辑: Javier，依赖操作系统进行负载平衡的预分叉进程根本无法很好地扩展。操作系统唤醒每一个当它获得连接时，所有进程都会启动，但只有其中一个进程会获得连接，而其他所有进程都会再次进入休眠状态。多进程模式下的 Haproxy 在 4 个进程左右时性能最佳。当进程数达到 8 个时，性能已经开始下降。Apache 对此使用了一个很好的技巧，它在 accept() 周围进行锁定，以便只有一个进程在等待接受。但这会破坏操作系统的负载平衡功能，并停止在 1000 到 2000 个进程之间进行扩展。它应该使用一些锁的数组，以便唤醒一些进程，但它没有这样做。

Question 2

由于没有关于您服务的任何详细信息，因此很难说；但一般来说，我倾向于预分叉。这是一个经过验证的服务器策略（而不是像某些人读过 tornado/unicorn 粉丝网站后认为的那样，是一种新奇的技巧）。

除此之外，还有一些提示：

每个预先分叉的进程可以使用现代非select策略（主要是 libevent）来处理大量客户端。
核心和进程之间 1：1 的关系很少能带来最佳性能；通常最好对负载进行一些动态适应。

Answer

由于没有关于您服务的任何详细信息，因此很难说；但一般来说，我倾向于预分叉。这是一个经过验证的服务器策略（而不是像某些人读过 tornado/unicorn 粉丝网站后认为的那样，是一种新奇的技巧）。

除此之外，还有一些提示：

每个预先分叉的进程可以使用现代非select策略（主要是 libevent）来处理大量客户端。
核心和进程之间 1：1 的关系很少能带来最佳性能；通常最好对负载进行一些动态适应。

对于给定的情况，您对软件负载平衡器或负载共享器有何建议？

答案1

答案2

相关内容