robots.txt 正在重定向到默认页面

Question 1

这取决于服务器配置，可能不允许 .txt 文件。配置或 .htaccess 中可能存在一条规则，该规则指定如果 URL 与特定模式（例如 .html、.php、.htm 等）不匹配，则会将其余内容重定向到 Web 根目录的索引页。

Answer

这取决于服务器配置，可能不允许 .txt 文件。配置或 .htaccess 中可能存在一条规则，该规则指定如果 URL 与特定模式（例如 .html、.php、.htm 等）不匹配，则会将其余内容重定向到 Web 根目录的索引页。

Question 2

补充一点信息，网络提供商根本没有被迫遵守 robots.txt 标准，因此可以用它做任何他想做的事情，而且就像 Serge 所说的那样，它可以重定向到任何地方。

Answer

补充一点信息，网络提供商根本没有被迫遵守 robots.txt 标准，因此可以用它做任何他想做的事情，而且就像 Serge 所说的那样，它可以重定向到任何地方。

Question 3

爬虫应该阅读robots.txt并遵守其限制，但网络服务器无法强制执行这一点。

.htaccess（或者服务器配置文件）可用于阻止不符合要求的爬虫，如果您知道他们是谁的话。

Answer

爬虫应该阅读robots.txt并遵守其限制，但网络服务器无法强制执行这一点。

.htaccess（或者服务器配置文件）可用于阻止不符合要求的爬虫，如果您知道他们是谁的话。

相关内容