我的服务器 CPU 使用率为 100%,查看 Apache 日志时,我发现有数十万个如下所示的连接:
10.190.45.31 - - [13/Mar/2014:15:29:02 +0000] "GET SOMETHING HTTP/1.1" 200 2261 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7 (via ggpht.com GoogleImageProxy)"
该 IP 是我的负载均衡器的 IP,不幸的是我没有设置日志记录,所以我无法识别这些请求的真正来源。
有人知道这是什么样的交通吗?
答案1
我也看到过这样的交通情况。
- IP 地址始终在
66.249.64.0/19
Google 拥有的范围内。 - 我看到的用户代理始终与您在那里看到的相同。
- 请求的 URL 大部分是图像,但有时不是。
- 大多数图片 URL 被请求多次。请求次数最多的前两张图片(顺便说一句,我们只在平台发送的电子邮件中包含这两张图片)占总请求次数的三分之二。
我很确定这与他们最近对 Gmail 进行了更改,使其可以自动加载电子邮件中的图片但通过代理来执行此操作,因此无法识别收件人。
这篇博客文章支持我的观点,并包含相同的 User-Agent。
您可以通过向您的 Gmail 地址发送一封包含如下标签的 HTML 电子邮件来测试这一点(当然,用您的域名代替example.com
):
<img src="http://example.com/this_probably_doesnt_exist.jpg">
如果您看到该 URL 有来自此 User-Agent 的同类型命中,那么我的猜测是正确的。