我正在镜像一个网站,但发生了一些事情,wget 死了。所以我不得不再次运行它,但我意识到Last-modified header missing -- time-stamps turned off.
输出中经常重复,所以我怀疑 wget 正在下载已经下载的文件,我该怎么办?
这是我原来的命令:
wget -m -nc -p -E -k -np -e robots=off www.site.com
这是我的恢复命令:
wget -m -c -p -E -k -np -e robots=off www.site.com
答案1
-nc
是--no-clobber
同时,-c
是--continue
。这是你的意图吗?
但是,服务器似乎不支持If-Modified-Since
标头。这使得 Wget 更难恢复下载。使用该-c
选项,wget 仍将尝试检查文件是否已完全下载,但这又取决于服务器处理Range:
标头的能力
如果至少共享 Wget 输出的一部分,我们可以为您提供更多帮助。最好启用--debug
开关