将网站移至新服务器 - 更新 DNS - 网络爬虫仍然通过 IP 访问旧网站

Question

这些爬虫的 DNS 缓存刷新可能需要很长时间，但 10 天对我来说似乎有点太长了。另一方面，你说他们通过 IP 访问你的网站，这肯定是错误的。老实说，这听起来更像是某个地方的链接不好，而且你的网络服务器没有将 IP 地址重定向到实际的 FQDN URL，然后爬虫继续浏览网站自己的相关链接（但这只是一种假设）。

我不会费心使用重定向，除非你打算长期运行这个旧服务器来做这件事。例如，我们在一年前就强制实施了 SSL（使用 301 重定向），但我们仍然通过纯 HTTP 收到大量请求。而且它们是指向特定资产（如下载）的直接链接，因此并不是他们在输入主地址时没有指定 https://。只要你继续提供服务，他们就会继续使用它。

如果这些相同的机器人也爬取你的新服务器，我真的不会介意。这是我的一点看法。

Answer 1

这些爬虫的 DNS 缓存刷新可能需要很长时间，但 10 天对我来说似乎有点太长了。另一方面，你说他们通过 IP 访问你的网站，这肯定是错误的。老实说，这听起来更像是某个地方的链接不好，而且你的网络服务器没有将 IP 地址重定向到实际的 FQDN URL，然后爬虫继续浏览网站自己的相关链接（但这只是一种假设）。

我不会费心使用重定向，除非你打算长期运行这个旧服务器来做这件事。例如，我们在一年前就强制实施了 SSL（使用 301 重定向），但我们仍然通过纯 HTTP 收到大量请求。而且它们是指向特定资产（如下载）的直接链接，因此并不是他们在输入主地址时没有指定 https://。只要你继续提供服务，他们就会继续使用它。

如果这些相同的机器人也爬取你的新服务器，我真的不会介意。这是我的一点看法。

将网站移至新服务器 - 更新 DNS - 网络爬虫仍然通过 IP 访问旧网站

答案1

相关内容