我正在尝试从网页下载所有图像。包含的图像如下:
<img src="https://alwaysSamePart.com/SomeRandomLinkThatVaries.jpg">
我应该如何参数化我的wget
命令以指定我只想要链接以“开头的图像”https://alwaysSamePart.com/“?因为接下来的内容每次都不同,所以我不能只指定一个硬编码链接。
答案1
wget -r -nd -A jpg --accept-regex "https://alwaysSamePart.com/.*.jpg" https://whatever_domain.com
-r
允许递归浏览网站(您可以指定-l
限制深度)-nd
防止目录创建-A
限制下载文件仅限 jpg 图像--accept-regex
仅将图像限制为所需的图案
答案2
您是否尝试过-A
或--accept
下面给出的等效选项?
wget "https://alwaysSamePart.com/" -A "*.jpg"