我想要下载本网站使用 wget,为此我使用以下命令:
wget.exe --no-clobber --no-parent -r --convert-links --page-requisites -U Mozilla "http://www.s-manuals.com/smd/"
这对我来说没问题,但链接的 PDF 文件位于与我的 URL 示例同一级别的文件夹中:
http://www.s-manuals.com/pdf/datasheet/a/f/afn3400_alpha-mos.pdf
所以我也需要下载该/pdf/
文件夹。问题是,如果它在同一级目录中,--no-parent
选项会避开该目录,但如果我删除,--no-parent
整个网站都将被下载,所以我想知道是否有一个选项允许我仅下载这两个文件夹?
答案1
您可以使用--include
选项来--no-parent
指定要包含在下载中的特定目录:
wget.exe --no-clobber -I /smd,/pdf -r --convert-links --page-requisites -U Mozilla "http://www.s-manuals.com/smd/"
查看基于目录的限制的文档更多细节。