有时我的电脑中会出现这样的行access.log
:
149.28.156.181 - - [13/Sep/2018:20:35:09 +0100] "GET /js/czjl.js HTTP/1.1" 301 184 "-" "Mozilla/5.0 ..."
/js/czjl.js
我的服务器上不存在该资源。但是,NGINX 的响应是 301,而不是 404。如果我使用 Postman 尝试相同的请求,我会得到
192.168.1.67 - - [13/Sep/2018:21:09:34 +0100] "GET /js/czjl.js HTTP/1.1" 404 1140 "-" "PostmanRuntime/7.3.0"
这是预期的行为。
如果这些资源不在我的服务器上,为什么 NGINX 返回 301 而不是 404?
这是我的配置
server {
listen 80;
server_name example.com www.example.com;
location ~ /.well-known {
allow all;
}
location / {
limit_except GET {
deny all;
}
return 301 https://www.example.com$request_uri;
}
location ~ /\. { deny all;}
}
server{
#FOR INTERNAL REQUESTS
listen 8080;
server_name 192.168.1.75;
error_page 401 403 404 /404.html;
location = /404.html {
root /var/www/html/error/;
internal;
}
location / {
limit_except GET {
deny all;
}
}
root /var/www/html;
index index.html;
}
server {
listen 443 ssl;
server_name example.com www.example.com;
location / {
limit_except GET {
deny all;
}
}
root /var/www/html;
index index.html;
error_page 401 403 404 /404.html;
location = /404.html {
root /var/www/html/error/;
internal;
}
#SSL Config
...
}
答案1
我的 Apache Web 服务器上有相同的日志消息。这有两个方面:为什么会发生 HTTP 301 重定向,以及为什么在 HTTP 301 重定向后没有记录后续 HTTP 请求。
在我的 Web 服务器上,我启用了从 http 到 https 的转发,以及从任何子域到正确子域的子域转发。这意味着任何 http 请求或错误子域上的任何请求(无论是有效资源还是无效资源)都将首先经过 HTTP 301 重定向。例如,当我访问时http://<mydomain>/js/czjl.js
,Apache 会记录 HTTP 301,因为首先将 http 请求转发到 https,但访问https://<mydomain>/js/czjl.js
将记录 HTTP 404。
创建Web 调用的方式http://<mydomain>/js/czjl.js
还将决定是否仅记录 HTTP 301,或者是否在记录 HTTP 301 后立即记录 HTTP 404。例如,使用此wget
命令会在我的 Web 服务器日志中触发 HTTP 301,而不会出现后续的 HTTP 404:
wget --max-redirect=0 http://<mydomain>/js/czjl.js
如果我省略该--max-redirect=0
选项,日志将显示 HTTP 301,然后显示 HTTP 404。但是,通过忽略重定向,wget 请求在从 Web 服务器获取 HTTP 301 响应后得到满足。我怀疑这些最终用户在他们的 Web 调用中使用了类似的“无重定向”选项,这导致偶尔出现指向不存在的资源的 HTTP 301。否则,我们的 Web 服务器会在 HTTP 301 之后记录 HTTP 404。