我有一长串需要下载的文件,语法如下:
https://url.url/YYYY/MM/DD/file.pdf
当然,YYYY 是年份,MM 是月份,DD 是日期。
有没有办法下载此列表中的文件并为每个文件指定一个 YYYY-MM-DD.pdf 格式的名称?或者保留目录并将每个 file.pdf 放在其正确的目录中?
答案1
这里你基本上有两个选择,并且根据你如何以及从哪里获取文件列表,一个可能比另一个更好:
您有一个所有 URL 的列表:在这种情况下,您唯一的选择是编写一个脚本,读取每一行,解析 URL 并使用正确的输出文件名调用 Wget。这非常容易做到(约 5 行 bash)
该网站有一个列表/index.html页面,链接到您想要的所有文件。这允许您使用该选项
wget
递归调用-r
。在这种情况下,整个文件层次结构将被保留。
答案2
下载文件时无法重命名。wget
将保留目录结构,您稍后可以按照所需的命名约定重命名文件。阅读man wget
(或https://manpages.ubuntu.com/manpages/bionic/en/man1/wget.1.html)