如何强制 wget 忽略某些重定向

如何强制 wget 忽略某些重定向

我正在尝试获取 URL(图像)列表,其中一些不再存在,主机重定向到通用的“此图像不存在”页面,我知道该页面的 URL。我想获取文件,除非它 302 到这个域,可以吗?

如果有使用标志进行重定向,我可以阻止它获取文件--max-redirect=0,但如果我点击镜像,这可能会停止获取真实图像

答案1

我能想到的实现此目的的唯一(非常黑客的)方法是在前面实现一个 HTTP 代理wget,它可以用错误代码覆盖“未找到图像”,这样您就不会下载它。

任何可配置的代理都应该能够获得这种行为 - 例如,使用 Apache 您可以执行以下操作:

ProxyRequests On
<Proxy http://example.com/path/to/image-not-found.jpg>
    Order allow,deny
    Deny from all
</Proxy>

相关内容