我们正在网站上为 Windows 使用 WGET 1.12(其中 follow_tags = a、reclevel = 8、recursive = on 和 timestamping = on wgetrc 设置),并且发现两个问题:
a.文件被删除,并创建同名目录,原文件丢失。
例如
URL:
http://some_site/abc
保存为文件:
some_dir/abc
进而…
网址:
http://some_site/abc/def
保存为文件:
some_dir/abc/def
这里删除了之前创建的文件 'abc',而是创建了一个名为 'abc' 的目录。'abc' 目录包含 'def' 文件,但原始的 'abc' 文件丢失了
b. 文件没有被删除而是抛出了错误
例如。
网址:
http://some_site/xyz/2006
保存为文件:
some_dir/xyz/2006
进而…
网址:
http://some_site/xyz/2006/12/aaa
未保存。它会给出错误。并且它不会删除之前创建的 2006 文件。
错误:some_dir/xyz/2006/12:没有此文件或目录
有人知道 WGET 存在此类问题吗?还是我的配置参数有问题?如果您需要更多信息,请告诉我。谢谢您的帮助。
问候,耐克
答案1
这是一个老问题,但在这里以与保存与资产目录同名的文件的问题相关的搜索结束。
最终在这里为我找到了解决方案: https://lists.gnu.org/archive/html/bug-wget/2010-07/msg00083.html
使用 -E 解决了我的问题。