我正在使用wget
1.12(如果有所不同,则在 msys 中),并尝试使用该-nd
选项镜像网站,因为此网站上的文件和文件夹名称非常长。文档指出
‘-nd’
‘--no-directories’
Do not create a hierarchy of directories when retrieving recursively.
With this option turned on, all files will get saved to the current
directory, without clobbering (if a name shows up more than once, the
filenames will get extensions ‘.n’).
但事实并非如此。同名文件不断被覆盖(想想大型网站上的 index.html)。我该如何获得正确的行为?
PS 名称之所以这么长,是因为它们是希伯来语,并且正在转换为 ascii %HH。还有其他方法可以做到这一点吗?
答案1
很可能您还使用了-N
( ),例如( )--timestamping
暗示了这一点。它有效地禁用了同名文件的保存。( ) 选项的手册中写道:-m
--mirror
-nc
--no-clobber
当使用“-N”运行 Wget 时……是否下载文件的较新副本取决于本地和远程的时间戳以及文件的大小
通常,如果有 2 个具有相同名称和不同路径的文件(例如index.html
),它们将具有不同的大小,并且由于时间戳的工作方式,如果使用-nd
选项,该文件将始终被覆盖。
您可以在以下文档中阅读更多内容时间戳。