wget 递归仅限于 URL 路径的子项

wget 递归仅限于 URL 路径的子项

我想使用递归选项下载以下子域wget

www.example.com/A/B

因此,如果该 URL 包含指向www.example.com/A/B/C和 的链接www.example.com/A/B/D,则也应该下载这两个。

但我不想www.example.com/A/B下载子域之外的任何内容。例如,如果www.example.com/A/B/C有一个链接回到www.example.com,则页面www.example.com应该不是可以下載。

wget我应该使用什么命令?

答案1

使用--no-parentwget 中的选项:

--no-parent

递归检索时,切勿上升到父目录。这是一个有用的选项,因为它可以保证只下载特定层次结构以下的文件。

答案2

尝试使用-I选项指定要包含在下载中的目录:

wget -r -I www.example.com/A/B/C,www.example.com/A/B/D

相关内容