每天有数千次访问无法追踪的网站流量——严重的问题

每天有数千次访问无法追踪的网站流量——严重的问题

一月底,我们注意到 JetPack 统计数据显示的主页/存档页面以及 Google 归类为 /gaming/(WordPress 中的存档列表)的流量激增。

一开始只有大约 3,000 名独立访客,一天之内就猛增到 65,000 名独立访客,而且全部都访问“主页”。这种情况持续了几周,我们以为我们受到了攻击。

随后几天流量下降,但随后又恢复,但每天只有大约 15,000 个独立访问量,此后每天都如此。我们得出结论,有些地方跟踪不正常,这是合法流量,因此将其忽略。

现在问题来了,Google AdSense 刚刚以“无效点击”为由禁用了我们的帐户。我们正在尝试找出这些流量的来源,如果这些流量不合法,则阻止它们,或者想办法正确跟踪它们。

网站规格:运行 CentOS 6 的专用服务器,带有 nginx、php-fpm 和 MySQL。网站使用 WordPress 构建,我们使用 CloudFlare 和 W3 Total Cache。使用的分析工具有 Google Analytics、Quantcast、Alexa 和 Compete。

任何形式的帮助都将非常有帮助。

更新: 我发现越来越多的人面临同样的问题,但似乎没有解决方案。

http://netmeg.com/bot-attack/

http://stkywll.com/2012/03/02/annoying-cyborgs-attach-distort-analytics/

查看访问日志后,我注意到它们都是 CloudFlare IP。我查看了这些日志,发现 CloudFlare 充当了代理,并且有一种方法可以修复 nginx 中的日志。它们来自美国的许多不同 ISP。它们将转到 /games/ 或 /gaming/(/games/ 重定向到 /gaming/),并且似乎都具有相同的用户代理 Mozilla/5.0(兼容;MSIE 9.0;Windows NT 6.1;Trident/5.0)。

答案1

是的,我在使用其他用户代理时遇到这个问题已经有一段时间了。

我们只是学会了如何适应流量...如果您想将不良页面浏览量排除在您的 Google 分析之外,或者暂停某些服务(例如 AdSense)(我们确实这样做了),您可以在此处了解更多信息:

http://stkywll.com/2012/04/27/annoying-robots-a-solution-for-google-analytics/

对此,基本上没有好的服务器端解决方案——上述解决方案基于浏览器中的点击和鼠标移动检测,到目前为止,这是区分此类好流量和坏流量的唯一好方法。

祝你们好运!

答案2

听起来您的网站可能已受到攻击,尤其是如果您的 AdSense 已被暂停。注册Google 网站管理员工具看看它是否报告任何恶意软件。通过运行Sucuri 的 Sitecheck也一样。安装WordPress 漏洞扫描器插件为了快速检查,请考虑将您的网站与 v3.4.1 的干净副本进行对比,并对您的插件和主题(包括 twentyten 和 twentyeleven 目录,这是恶意软件文件的常见藏身之处)进行同样的操作。我看到很多网站都是通过不安全的插件和第三方库(如 timthumb)被控制的,所以这绝对是一个需要注意的载体。

为 实施某种保护措施/wp-login.php,我管理的所有 WordPress 网站都会定期自动受到暴力破解攻击,因此如果您的任何用户的密码较弱,您就可能受到攻击。我倾向于在我的 nginx 配置中保护此位置,方法是限制登录的 IP 范围(如果客户端允许)、使用速率限制limit_req_zone和/或安装插件,例如登录锁定Duo 的双重身份验证或者适用于 WordPress 的 Google 身份验证器。我见过一些黑客,垃圾邮件发送者会以管理员身份登录博客,然后更改内容,而不是试图拥有该框,通常目的是利用网站的 Pagerank 来获得反向链接提升。

如果您已经排除了网站遭到任何形式的黑客攻击的可能性,但仍然有恶意访问者故意试图破坏您广告的点击,那么在他们有机会之前屏蔽和禁止他们的做法将改善情况。不良行为插件可以做到这一点,可能很合适(虽然它相当激进,所以请密切关注其禁令名单和白名单),或者,如果你想在较低的级别上做到这一点,请查看纳克西对于 nginx 或失败2ban

答案3

非常简单。只需在根目录中打开 index.php 并将其添加到开头:

$useragent = $_SERVER['HTTP_USER_AGENT'];

if ($useragent == "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)")
    {
    header("Location: http://www.google.com/");
    exit();
    }

由于所有这些 IP 地址都来自不同的 IP 地址,因此阻止这些 IP 地址既不实际,也不现实,也不省时。但由于它们都具有相同的用户代理,因此您可以直接阻止它。这只会将使用该用户代理的任何人重定向到 Google。我能想到的唯一可能的缺点是,如果任何合法访问者具有相同的用户代理,他们也会被重定向到 Google。为了解决这个问题,您可以让他们输入验证码或其他东西,而不是重定向到 Google。

感谢@Oerd 添加了重要的退出/死亡语句。

相关内容