谷歌对 SSL 不匹配内容进行索引的奇怪行为

谷歌对 SSL 不匹配内容进行索引的奇怪行为

这对你们来说有点奇怪。我们有一个服务器,它有多个 VHOSTS,包括 SSL 域和非 SSL 域。

Domain1 启用了 SSL,而 Domain2 没有启用 SSL。

由于所有这些域名都托管在同一个 IP 上,因此 apache 会通过加载第一个启用 SSL 的 vhost 来响应 domain2 上的 httpS 请求,因此基本上如果您访问 httpS :// domain2 浏览器会警告您 SSL 不匹配,这将要求用户在看到 Domain1(Apache 的第一个 SSL 域)的内容之前单击高级设置

1)如果 Chrome 足够聪明,能够理解 SSL 不匹配,那为什么 Google 仍然会索引 Domain1 下的内容?https://domain2.com

2) 此后,我们通过重写显示 404 的 httpS // domain2.com 所有页面解决了该问题,我们还使用 Google 网站管理员工具删除了所有 httpS // domain2.com 条目,但是,这些条目每 4-6 周就会再次出现!我甚至使用 Google 的抓取 URL 工具来确保 httpS // domain2.com 从他们的角度来看结果为 404,结果确实如此。

Google 怎么还能在 httpS // Domain2.com 下找到 Domain1 的内容?即使在删除请求之后,他们是否仍然依赖缓存?

我所能想到的是,谷歌在本地缓存了内容,并不断使用该内容再次创建索引;这意味着一旦我们手动请求删除内容,他们就不会抓取网站来重新创建该索引,而是依赖他们自己的本地缓存副本。

相关内容