我正在寻找已知机器人的 IP 地址数据库,以便能够在网站流量中识别它们。
我有用户代理数据,但似乎有很多没有提供用户代理来识别自己。这些往往是垃圾邮件机器人。
我知道蜜罐项目,但我不知道它是否有我可以轻松访问的数据库。
答案1
从来没听说过。
由于大多数垃圾邮件机器人和类似程序可能都在受感染的家用机器上运行,因此任何此类列表很快就会过时,因为一些主机已被清理,而机器人会通过某种方式被引入到其他主机,而且无论如何也不会过于有用 - 您所能做的就是阻止来自列表中主机的网络流量,或在网络服务器的脚本响应中添加一条消息,通知用户他们可能已被感染。
在我看来,向用户发送消息是浪费时间 - 许多人会忽略它,许多应该看到它的人不会看到它,因为你不会在数据库中拥有他们的正确地址(由于他们没有固定地址,通过具有多个向外地址的代理访问,或者他们的合法流量通过机器人流量绕过的代理,而那些你设法正确告知问题的人可能会期望你知道如何为他们解决这个问题...
答案2
可能最好的选择是:xbl.spamhaus.org。来自网站:
Spamhaus 漏洞阻止列表 (XBL) 是一个实时数据库,其中包含被非法第三方漏洞感染的被劫持 PC 的 IP 地址,包括开放代理(HTTP、socks、AnalogX、wingate 等)、内置垃圾邮件引擎的蠕虫/病毒以及其他类型的木马漏洞
毫无疑问,许多垃圾邮件的来源都是来自被利用的服务器,因此这取决于您对“机器人”的定义。许多垃圾邮件发送者租用服务器并仅从中发送垃圾邮件 - 他们不会从这些服务器进行太多合法的网页浏览。您确实可以使用任何垃圾邮件 RBL,并且可能很好地了解有多少网络流量来自受感染的服务。