使用 Wget 我无法下载整个网站

Question 1

今天我明白了，问题不在于递归或延续的选项，而在于 301 响应返回。我仍然不明白为什么第一次会遵循，但现在一切正常。我可以停止作业并恢复，检查每个文件后 wget 将下载新的内容或继续之前的下载。一如既往，有人遇到同样的问题，这是链接 https://lists.gnu.org/archive/html/bug-wget/2019-11/msg00036.html

如果可以帮助某人，我现在使用的命令是 wget -r --mirror -N -l inf --no-parent -R --trust-server-names --content-disposition --continue --domains site https://网站

正如您在过去的问题中看到和阅读的那样，允许跟随重定向的选项是 --trust-server-names。然后我结合 --content-disposition ，一切正常。

感谢大家的帮助

Answer

今天我明白了，问题不在于递归或延续的选项，而在于 301 响应返回。我仍然不明白为什么第一次会遵循，但现在一切正常。我可以停止作业并恢复，检查每个文件后 wget 将下载新的内容或继续之前的下载。一如既往，有人遇到同样的问题，这是链接 https://lists.gnu.org/archive/html/bug-wget/2019-11/msg00036.html

如果可以帮助某人，我现在使用的命令是 wget -r --mirror -N -l inf --no-parent -R --trust-server-names --content-disposition --continue --domains site https://网站

正如您在过去的问题中看到和阅读的那样，允许跟随重定向的选项是 --trust-server-names。然后我结合 --content-disposition ，一切正常。

感谢大家的帮助

Question 2

您正在寻找的是一种选项--timestamping（-N简而言之），该选项仅检索比现有文件更新的文件。

仅供参考，我有时实际使用的命令是：

wget -c -N -mirror -pc --convert-links -P ./mirror $SITE_URL

Answer

您正在寻找的是一种选项--timestamping（-N简而言之），该选项仅检索比现有文件更新的文件。

仅供参考，我有时实际使用的命令是：

wget -c -N -mirror -pc --convert-links -P ./mirror $SITE_URL

使用 Wget 我无法下载整个网站

答案1

答案2

相关内容