为什么 NGINX 会针对不存在的资源返回 301?

为什么 NGINX 会针对不存在的资源返回 301?

有时我的电脑中会出现这样的行access.log

149.28.156.181 - - [13/Sep/2018:20:35:09 +0100] "GET /js/czjl.js HTTP/1.1" 301 184 "-" "Mozilla/5.0 ..."

/js/czjl.js我的服务器上不存在该资源。但是,NGINX 的响应是 301,而不是 404。如果我使用 Postman 尝试相同的请求,我会得到

192.168.1.67 - - [13/Sep/2018:21:09:34 +0100] "GET /js/czjl.js HTTP/1.1" 404 1140 "-" "PostmanRuntime/7.3.0"

这是预期的行为。

如果这些资源不在我的服务器上,为什么 NGINX 返回 301 而不是 404?

这是我的配置

server {
    listen 80;

    server_name example.com www.example.com;

    location ~ /.well-known {
        allow all;
    }

    location / {
        limit_except GET {
            deny all;     
        }
        return 301 https://www.example.com$request_uri;
    }

    location ~ /\. { deny all;}

}

server{
    #FOR INTERNAL REQUESTS

    listen 8080;

    server_name 192.168.1.75;
    error_page 401 403 404 /404.html;
    location = /404.html {
            root /var/www/html/error/;
            internal;
    }

    location / {
        limit_except GET {
            deny all;     
        }
    }

    root /var/www/html;
    index index.html;
}

server {
    listen 443 ssl;

    server_name example.com www.example.com;

    location / {
        limit_except GET {
            deny all;     
        }
    }

    root /var/www/html;
    index index.html;
    error_page 401 403 404 /404.html;
    location = /404.html {
            root /var/www/html/error/;
            internal;
    }

    #SSL Config
    ...
}

答案1

我的 Apache Web 服务器上有相同的日志消息。这有两个方面:为什么会发生 HTTP 301 重定向,以及为什么在 HTTP 301 重定向后没有记录后续 HTTP 请求。

在我的 Web 服务器上,我启用了从 http 到 https 的转发,以及从任何子域到正确子域的子域转发。这意味着任何 http 请求或错误子域上的任何请求(无论是有效资源还是无效资源)都将首先经过 HTTP 301 重定向。例如,当我访问时http://<mydomain>/js/czjl.js,Apache 会记录 HTTP 301,因为首先将 http 请求转发到 https,但访问https://<mydomain>/js/czjl.js将记录 HTTP 404。

创建Web 调用的方式http://<mydomain>/js/czjl.js还将决定是否仅记录 HTTP 301,或者是否在记录 HTTP 301 后立即记录 HTTP 404。例如,使用此wget命令会在我的 Web 服务器日志中触发 HTTP 301,而不会出现后续的 HTTP 404:

wget --max-redirect=0 http://<mydomain>/js/czjl.js

如果我省略该--max-redirect=0选项,日志将显示 HTTP 301,然后显示 HTTP 404。但是,通过忽略重定向,wget 请求在从 Web 服务器获取 HTTP 301 响应后得到满足。我怀疑这些最终用户在他们的 Web 调用中使用了类似的“无重定向”选项,这导致偶尔出现指向不存在的资源的 HTTP 301。否则,我们的 Web 服务器会在 HTTP 301 之后记录 HTTP 404。

相关内容