从网站递归下载

Question 1

wget -nd -r -l1 -P /save/location -A jpeg,jpg http://www.example.com/products

解释：

-nd防止创建目录层次结构（即没有目录）。

-r启用递归检索。看递归下载了解更多信息。

-l1指定递归最大深度级别。 1 对于您的情况，仅此目录是products.

-P设置保存所有文件和目录的目录前缀。

-A设置白名单以仅检索某些文件类型。接受字符串和模式，并且两者都可以在逗号分隔的列表中使用（如上所示）。看文件类型了解更多信息。

Answer

wget -nd -r -l1 -P /save/location -A jpeg,jpg http://www.example.com/products

解释：

-nd防止创建目录层次结构（即没有目录）。

-r启用递归检索。看递归下载了解更多信息。

-l1指定递归最大深度级别。 1 对于您的情况，仅此目录是products.

-P设置保存所有文件和目录的目录前缀。

-A设置白名单以仅检索某些文件类型。接受字符串和模式，并且两者都可以在逗号分隔的列表中使用（如上所示）。看文件类型了解更多信息。

Question 2

尝试一下httrack(1)，一个网络蜘蛛，它对于创建整个网站的本地镜像最有用。

链接的联机帮助页中的示例应该可以帮助您入门。

Answer

尝试一下httrack(1)，一个网络蜘蛛，它对于创建整个网站的本地镜像最有用。

链接的联机帮助页中的示例应该可以帮助您入门。

Question 3

wget -nH --page-requisites -R -nH -P mirrorDirectory https://example.com

其中，mirrorDirectory 是要存储输出的路径。

Answer

wget -nH --page-requisites -R -nH -P mirrorDirectory https://example.com

其中，mirrorDirectory 是要存储输出的路径。

相关内容