wget 不下载网站的图像?

wget 不下载网站的图像?

我正在尝试使用 wget 下载包含许多图像的网络论坛的线程。这些图像托管在单独的域中,因此我使用 -H 标志来允许下载它们。我使用的完整 wget 命令是:

wget -p -H -erobots=off https://example.com/

当我使用它时,几乎下载了除主图像之外的所有内容。这是我正在尝试的其中一个线程的示例下载

我做错了什么?

答案1

这是站点特定的问题。跑步

 wget -H -p -r --user-agent="Mozilla/5.0" -nd --accept jpg,png https://suzuki88.mforos.com/194412/11461305-brico-con-mi-nuevo-suzuki-en-proceso-de-transformacion-muchas-fotos/

给我一个 robots.txt.* 文件的列表,内容如下:

User-agent: *
Disallow:

这基本上意味着该网站认为您是一个试图修补该网站的某些安全漏洞的机器人。规则是拒绝*(所有)机器人访问网站的任何部分。

相关内容