Wget 不以递归下载方式下载图像

Wget 不以递归下载方式下载图像

我使用此命令以 5 个级别递归下载网页以进行离线导航:

wget -r -p --convert-links http://www.pythondiario.com

但图像未正确下载。

我该如何解决?

答案1

作为佐藤桂评论中指出,此页面上的某些图像位于不同的主机上。默认情况下,wget 不遵循跨主机链接(这适用于图像检索以及递归遍历)。

要使 wget 遵循跨主机链接,请传递该-H选项。建议-D同时传递该选项来限制遍历哪些主机,否则您将面临下载大量链接内容的风险。

wget -r -p --convert-links -H -Dblogspot.com http://www.pythondiario.com

请注意,-H-D适用于递归遍历以及图像。您可以通过添加-R或选项进一步限制跨主机链接--reject-regex

手册中的“跨主机”更多细节。

相关内容