奇怪的 NGINX 日志条目

Question

我认为没有必要进一步调试这个问题，因为有些事情是显而易见的：

python-requests/2.20.0as User-Agent 表示一些 Python 脚本。流行的Pythonrequests库使编写简单的机器人变得非常容易，无论好坏。

如果 NGINX 中有一个允许响应任何Host:标头的默认服务器，则向未知主机名返回 200 可能是很典型的。

请原谅我的措辞，但是默认情况下，NGINX 中的默认服务器将响应任何Host:。然后，要200返回，您的应用必须不检查域名，并且不针对您网站的规范域名发出重定向。

就像在典型情况下“您知道您托管哪些域”一样，任何带有外部域名（或无域名）的请求都可能被视为恶意/不受欢迎的。

你可能想看看蜜罐阻断方法对于“域名不是您的”这种请求 - 大多数恶意/坏机器人实际上只会提供裸IP作为标Host:头的值，仅仅是因为他们懒得检查给定IP上位于哪些域名（请注意，他们只是通过枚举网络/IP地址来找到受害者）。

对于使用完整 URL 而不是 URI 的请求，这可能是任何东西，包括编写不良的机器人、代理检查器等。

如果您有很多这样的请求，并且在您的后端生成 404 错误，我建议直接在配置中使用简单规则拒绝此请求，并可能添加即时阻止，而不是使用 Fail2ban。

location ~ "^https?:/" {
    return 404;
}

Answer 1