大型网站的负载共享

Question

除非你的应用程序需要大量的处理能力，否则你很可能在此之前就耗尽网络带宽。这会带来两个后果：

负载平衡交换机在处理占据大部分请求处理且同步并不重要的场景中最有用，例如在构建搜索引擎时（查询很复杂，数据集未被修改，因此单个服务器可以在私有副本上工作，对几个小时前的数据进行操作是完全可以接受的）。

对于需要登录的应用程序，您可能需要一个单独的基础设施来跟踪能够反应更快的用户和会话，例如包含用户数据和凭据信息的复制数据库，以及可以确定会话 ID 有效性的单独服务。

一种可能的实现方式是通过对用户 ID、发出 cookie 的服务器 ID 和接受凭证的时间戳进行数字签名来生成会话 ID cookie；然后，各个前端服务器可以联系登录服务器来查询 cookie 的有效性（在实际场景中，您可能希望在那里进行一些优化）。

共享数据集难以管理，而如何最好地实现这一点的答案在很大程度上取决于相关的应用程序；这将是一篇较长的文章。

当硬件使用不足或需要快速更换时，虚拟化会有所帮助。它与负载平衡无关，但绝对是您为服务分布的各个服务器使用的工具之一。

Answer 1

除非你的应用程序需要大量的处理能力，否则你很可能在此之前就耗尽网络带宽。这会带来两个后果：

负载平衡交换机在处理占据大部分请求处理且同步并不重要的场景中最有用，例如在构建搜索引擎时（查询很复杂，数据集未被修改，因此单个服务器可以在私有副本上工作，对几个小时前的数据进行操作是完全可以接受的）。

对于需要登录的应用程序，您可能需要一个单独的基础设施来跟踪能够反应更快的用户和会话，例如包含用户数据和凭据信息的复制数据库，以及可以确定会话 ID 有效性的单独服务。

一种可能的实现方式是通过对用户 ID、发出 cookie 的服务器 ID 和接受凭证的时间戳进行数字签名来生成会话 ID cookie；然后，各个前端服务器可以联系登录服务器来查询 cookie 的有效性（在实际场景中，您可能希望在那里进行一些优化）。

共享数据集难以管理，而如何最好地实现这一点的答案在很大程度上取决于相关的应用程序；这将是一篇较长的文章。

当硬件使用不足或需要快速更换时，虚拟化会有所帮助。它与负载平衡无关，但绝对是您为服务分布的各个服务器使用的工具之一。

我的理解：