Apache 日志充斥着连接 - “(来自 ggpht.com GoogleImageProxy)”

Apache 日志充斥着连接 - “(来自 ggpht.com GoogleImageProxy)”

我的服务器 CPU 使用率为 100%,查看 Apache 日志时,我发现有数十万个如下所示的连接:

10.190.45.31 - - [13/Mar/2014:15:29:02 +0000] "GET SOMETHING HTTP/1.1" 200 2261 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7 (via ggpht.com GoogleImageProxy)"

该 IP 是我的负载均衡器的 IP,不幸的是我没有设置日志记录,所以我无法识别这些请求的真正来源。

有人知道这是什么样的交通吗?

答案1

我也看到过这样的交通情况。

  • IP 地址始终在66.249.64.0/19Google 拥有的范围内。
  • 我看到的用户代理始终与您在那里看到的相同。
  • 请求的 URL 大部分是图像,但有时不是。
  • 大多数图片 URL 被请求多次。请求次数最多的前两张图片(顺便说一句,我们只在平台发送的电子邮件中包含这两张图片)占总请求次数的三分之二。

我很确定这与他们最近对 Gmail 进行了更改,使其可以自动加载电子邮件中的图片但通过代理来执行此操作,因此无法识别收件人。

这篇博客文章支持我的观点,并包含相同的 User-Agent。

您可以通过向您的 Gmail 地址发送一封包含如下标签的 HTML 电子邮件来测试这一点(当然,用您的域名代替example.com):

<img src="http://example.com/this_probably_doesnt_exist.jpg">

如果您看到该 URL 有来自此 User-Agent 的同类型命中,那么我的猜测是正确的。

相关内容