根据每个连接选择性地使用透明代理

Question

根据我的经验，透明 HTTP 代理通常对用户会话几乎没有影响。

不过，你的策略和你真正想要实现的目标在我看来似乎不太清楚。我认为 HTTP 的工作方式的现实会给你带来问题。也许你可以从最终结果的角度多谈谈你真正想要实现的目标。我并不是说这是一个“糟糕的主意”，而是你希望获得什么完全不清楚。

从 HTTP 协议的角度来看，您的策略存在一个重大问题。根据定义，您的第 7 层防火墙在发出请求之前无法知道所请求资源的 MIME 类型。您可以对文件名进行匹配（查看它是否以“.html”结尾等），但任何 URL 都可以返回任意 MIME 类型。这.b0rk 文件是text/html，但防火墙上的匹配规则.html不会.htm“知道”这一点。必须向远程服务器发出请求，并且远程服务器必须做出响应，然后才能知道 MIME 类型。

为什么您认为其他类型的文件（CSS、Javascript、图像等）是“静态的”。它们当然不必如此。任何 URL 引用的对象都可以是“动态的”。

如果您担心带宽成本，为什么不直接在本地托管透明代理呢？本地代理不会产生十分之一秒的请求到达代理的延迟，而且您不会产生与从第三方数据中心发送所有数据相关的潜在带宽成本。当代理缓存对象并让它缓存所有内容（它可以缓存的）时，您还会看到本地带宽利用率有所改善。

我曾经通过 Squid-cache 实例运行过一个 1,000 座位的教育网络，而这个网络运行的硬件在今天看来简直是微不足道。除非你谈论的是一个非常非常大的网络，否则一台非常普通的机器就可以为你处理负载。如果你担心单点故障，你可以考虑使用Web 缓存通信协议（WCCP），如果您的边缘设备支持，则可以在几个缓存之间进行故障转移。

如果您打算通过这种方式扫描 HTML 中的“恶意”代码，那么我认为您的想法是错误的。我更担心 Javascript 和application/octet-stream对象中的恶意代码，而不是对象text/html。无论如何，我对扫描持怀疑态度，因为任何东西都可能被充分混淆，从而被扫描漏掉（请参阅停机问题）。除非您要进行 SSL 拦截，否则您还会错过通过 HTTPS 传输的任何内容。扫描能捕获已知漏洞，我确实认为这是 IT 安全架构的有效组成部分，但 0day 漏洞几乎总是会溜走。

Answer 1

根据我的经验，透明 HTTP 代理通常对用户会话几乎没有影响。