wget 仅从站点下载某些文件夹

wget 仅从站点下载某些文件夹

我想要下载本网站使用 wget,为此我使用以下命令:

wget.exe --no-clobber --no-parent -r --convert-links --page-requisites -U Mozilla "http://www.s-manuals.com/smd/"

这对我来说没问题,但链接的 PDF 文件位于与我的 URL 示例同一级别的文件夹中:

http://www.s-manuals.com/pdf/datasheet/a/f/afn3400_alpha-mos.pdf

所以我也需要下载该/pdf/文件夹。问题是,如果它在同一级目录中,--no-parent选项会避开该目录,但如果我删除,--no-parent整个网站都将被下载,所以我想知道是否有一个选项允许我仅下载这两个文件夹?

答案1

您可以使用--include选项来--no-parent指定要包含在下载中的特定目录:

wget.exe --no-clobber -I /smd,/pdf -r --convert-links --page-requisites -U Mozilla "http://www.s-manuals.com/smd/"

查看基于目录的限制的文档更多细节。

相关内容