由于搜索引擎爬虫正在拖垮该网站(该网站有数百万个页面),我刚刚为几个实例设置了 AWS 负载均衡器。该网站的部分内容允许您登录,因此我选择了:
启用应用程序生成的 Cookie 粘性
并且一切正常。
我现在想知道这会对我的 SEO 和爬虫产生什么影响。我选择了粘性负载平衡,这是否意味着爬虫将停留在一台服务器上,从而破坏了负载平衡器中的要点?
任何建议都将受到赞赏。
答案1
由于 ELB 使用面向 cookie 的粘性,因此爬虫程序永远不会停留在单个实例上。但是,由于您在这里处理的显然是一个垃圾爬虫(因为它正在对您的网站进行 DoS 攻击),它可能会愚蠢到保留它获得的 cookie,在这种情况下,您将受到攻击。
就我个人而言,我建议摆脱会话亲和性并修复您的应用程序以使其不再需要它 - 有很多方法可以进行共享会话存储。
答案2
应用程序生成的 Cookie 粘性意味着您的应用程序必须删除负载均衡器寻找以分配亲和性的 Cookie。如果没有 Cookie,请求将随机分配给哪个服务器。
除非您已修改应用以删除亲和性 cookie,否则您可能希望改为选中“启用负载均衡器生成的 Cookie 粘性”。这样,ELB 本身就会在您设置的持续时间内删除一个 cookie,并让用户一直使用同一台服务器,直到 cookie 过期。