代理自动保存特定 URL

代理自动保存特定 URL

我正在寻找可以执行以下操作的网络代理:

如果请求的 URL 与某种模式匹配(正则表达式是理想的),则将传输保存到指定的文件夹。

我不确定是否可以用 Squid(我已经在运行)实现这一点,但我愿意使用其他工具。

谢谢!

答案1

实现此目的的方法是使用 韋夫:在“在线”模式下,wwwoffle 会将所有访问过的页面(除与指定正则表达式匹配的页面外)保存到一个文件夹中。您可以配置缓存文件夹路径。

据我所知,没有直接的方法可以告诉 WWWOFFLE 要保存哪些页面/URL,但可以有解决方法:

  • 如果你可以否定你的正则表达式,你可以告诉 WWWOFFLE 哪些页面 不是保存

  • 如果你的浏览器支持 代理服务器基于 JavaScript 的代理配置,可以直接编写一个 JavaScript 函数,指示浏览器仅对与正则表达式匹配的 URL 使用代理。

  • 您也许能够将 Squid 配置为在 URL 与特定模式匹配时使用 WWWOFFLE 作为父代理;即,当请求 URL 与正则表达式匹配时,浏览器->Squid->WWWOFFLE->Internet,否则浏览器->Squid->Internet。

相关内容