tl;dr:'wget --no-parrent -r' 会从给定 url 目录上方的目录下载吗?
当使用 wget 下载图片时,使用 -r 和 -np 选项从 example.com/a/b 递归下载,如果 example.com/a/b/ 提供包含图片链接的 html 文件,那么 example.com/a/c/ 下的图片会被下载吗?如果会,我如何获取文件夹及其子文件夹中的所有图片,并且只获取这些图片?选项 --no-parent 的描述是“递归检索时,永远不要上升到父目录”。无论如何,目录浏览都会提供父目录的链接,尽管提到了选项,wget 仍会遵循该链接。现在我错过了什么?
编辑:使用 GNU Wget 1.12
答案1
我刚刚进行了一些测试适用于 Windows 的 WGET 1.10.2并且它按预期工作。
确保在目录末尾添加一个斜杠,例如,表示b是A其中没有文件:
> wget … hxxp://example.com/a/b/
如果仍然不起作用,请尝试指定一些递归排除选项:
--reject=htm,html
--ignore-tags=a
--exclude-directories=http://example.com/a/c/