使用代理来混淆互联网流量的频率是多少?大多数公司是否直接连接到互联网(在使用代理缓存和过滤内容后),或者他们的流量是否经过某种混淆,这是允许的吗?
我很好奇,是否有更好的方法来跟踪特定客户端的页面浏览量,即使他们的 IP 地址发生变化,而无需使用 cookie。最好的猜测是使用他们的 http 标头(用户代理、语言环境),但这并不能提供那么多信息。
这里有几个问题。
- 代理多久使用一次来混淆流量?
- 公司会这样做吗?
- 如何在不依赖 cookie/远程地址的情况下最好地识别唯一访问者。
答案1
大多数大公司都会代理所有互联网流量,但这并不是为了混淆视听。大多数公司代理的目的是为了过滤和缓存。
回答您的问题:
几乎从来不是为了混淆,通常是为了过滤和保护 IP。
公司通常会有一个代理来处理其出站互联网流量。
可能是堆栈溢出问题,需要使用代码来唯一标识它。对于匿名用户来说,这将是一项艰巨的任务。
答案2
我不确定你说的“混淆流量”是什么意思,但大多数规模适中的公司至少会使用某种形式的NAT这样所有客户端在外界看来都拥有相同的 IP 地址。目的不是专门混淆流量,而是将内部 IP 地址与公共 IP 地址隔离(出于安全目的),并减轻可用公共 IP 地址的压力。
答案3
代理在大公司中非常常见。即使没有其他好处,缓存收益也可能非常巨大。
如果您希望某个页面对某个用户(而不是某个 IP 等)是唯一的,请在客户端使用某些东西来跟踪他们。有两种常用方法可以做到这一点:
- 饼干
- 唯一 URL 令牌 (yourpage.php?USER=HUGESTRINGTHATREFERSTOTHEUSERINYOURDATABASE)