我应该如何最大限度地减少 404 网络流量的影响?

我应该如何最大限度地减少 404 网络流量的影响?

最近,我工作的其中一个网站开始发现一些奇怪的流量,这些流量指向一些不存在或从未存在过的 URL。

类似页面:

  • /imprss/123go.php
  • /imprss/24cpv.php
  • /bnnrs1002/728x90/4b4254ab5edd4.html
  • /bnnrs1002/728x90/4b4254ab5f59e.html
  • /bnnrs1002/728x90/4b4254ab5e1f8.html

事实上,到目前为止,已经有超过 300 个不同的 URL......其中没有一个与网站上曾经出现过的任何内容相似。

因此,所有这些页面自然都会重定向到我们的 404 页面,而该页面恰好是我们网站地图的修改版本。问题是,我们每天会看到数千个这样的 404 页面,而且我担心这个数字还会增长。此外,我查看了服务器日志,没有发现所有这些流量都来自任何通用 IP 地址。

所以我的第一个想法是精简和简化 404 页面。这是尽量减少服务器负载和减少带宽的第一步。

我还确信这些流量要么来自机器人,某种恶意软件,要么来自完全不感兴趣的用户,因为我用我们使用的几个工具跟踪了这些会话,发现他们在点击 404 页面后从未真正使用过该网站。

那么我还能做些什么来更好地检测这些流量模式?如果我能彻底解决这个问题就好了。

答案1

这种“探测“有人猜测特定目录是否存在。这是一种分析某些页面的存在表明安装了某些软件在服务器上,或者某些用户名可能存在在服务器上,并且可能是其他类型黑客攻击的前兆。

我运营着多个网站,它们几乎每天都会遭遇这种探测。

它们来自不同的 IP 地址这一事实可能表明探测是通过僵尸网络进行的 - 特别是如果跨不同 IP 地址的探测似乎存在某种模式。

你无法阻止这种情况发生;但是,你绝对可以通过提供非常简单的 404 页面。它也可以提醒您确保所有软件都已修补且为最新版本,并且在任何面向互联网的服务器上都设置了强密码。

答案2

如果您有足够多的共同点(例如 /impress/* 和 /bnnrs1002/*),那么您可以放置​​一个重写模块来将这些请求发送到其他地方。例如,发送到一个非常小的自定义错误页面或其他“Bugger Off”页面。这将有助于在您尝试放置更强大的东西时节省带宽。

答案3

好吧,如果他们实际上只针对每个 IP 地址访问您一次,针对所有不同的页面,那么您实际上别无选择,只能精简 404 页面……或者您可以将他们重定向到首页并将其声明为页面浏览量……;)

相关内容