阻止来自开发服务器和静态资产域的机器人/蜘蛛

Question

首先，您应该在域的根目录中提供一个有效的 robots.txt 文件。这是要求 Google 和其他合法网络爬虫不要浏览您的网站的常用方法。

使用 nginx 等可以很容易地禁止选定的用户代理：

if ($http_user_agent ~ (Googlebot|bingbot|whatever) ) {
    return 403;
}

您可以将此代码放在单独的文件中，并将其包含在每个server块中。

Answer 1

首先，您应该在域的根目录中提供一个有效的 robots.txt 文件。这是要求 Google 和其他合法网络爬虫不要浏览您的网站的常用方法。

使用 nginx 等可以很容易地禁止选定的用户代理：

if ($http_user_agent ~ (Googlebot|bingbot|whatever) ) {
    return 403;
}

您可以将此代码放在单独的文件中，并将其包含在每个server块中。

相关内容