我想使用递归选项下载以下子域wget
:
www.example.com/A/B
因此,如果该 URL 包含指向www.example.com/A/B/C
和 的链接www.example.com/A/B/D
,则也应该下载这两个。
但我不想www.example.com/A/B
下载子域之外的任何内容。例如,如果www.example.com/A/B/C
有一个链接回到www.example.com
,则页面www.example.com
应该不是可以下載。
wget
我应该使用什么命令?
答案1
使用--no-parent
wget 中的选项:
--no-parent
递归检索时,切勿上升到父目录。这是一个有用的选项,因为它可以保证只下载特定层次结构以下的文件。
答案2
尝试使用-I
选项指定要包含在下载中的目录:
wget -r -I www.example.com/A/B/C,www.example.com/A/B/D