当我加入该网站时,我试图找到绕过 cloudflare 和 blazingfast 重定向的方法。
我想绕过这个限制并从目标下载html代码。
我找到了一些有关 pass cloudflare 的信息,但仍然不适合我。
我尝试从受 blazinfast 保护的 xyz.com 网站复制 cookie 文件并将其放入 cURL 中,但没有成功。
我尝试了 lynk 浏览器,但也无法得到解决方案。
你怎么能绕过这个限制呢?
答案1
cloudflare 的工作方式是充当站点和用户之间的防火墙。显然,如果有办法直接访问该站点,这根本行不通。 cloudflare 的主要卖点是防止 ddos 攻击,所以如果你可以绕过 cloudflare,那就违背了使用 cloudflare 的全部意义,如果你停下来想一想,这一点是显而易见的。
基本上,您必须检查一些事情,所有这些都意味着站点配置不正确:
看看您是否可以在其实际 IP(cloudflare 用于访问该站点的 IP)的某处找到旧记录。如果不存在此类记录,则不应该存在,因为如果您使用 cloudflare,您应该将 IP 地址更改为只有 cloudflare 知道的新地址。所以这就是配置错误之一。
其次,您然后尝试直接通过其 IP 地址访问有问题的站点,如果它有适当的重写规则,任何不是域名的访问都会被重写为其域名,这意味着它会被发送回到 cloudflare 防火墙,故事就结束了。
我对 blazingfast 一无所知,但除非该网站完全搞乱了其 cloudflare 设置,否则仅此一项就应该禁用通过 http/https 与网站上任何文件的任何可能的直接连接。
有时您可以找到列出的站点的旧 IP 地址,但是,如果该站点正确设置了其 cloudflare,他们会在切换到 cloudflare 时更改 IP,以消除这种机会检测。
在技术层面上,任何人想要做这样的事情的唯一原因是因为他们正是 Cloudflare 所要防范的人。
显然,您可以通过浏览器访问任何网页 html,但 cloudflare 还采用了一些其他技巧,使得使用命令行工具下载实际站点 html 变得困难甚至不可能,因为某些功能会根据安全级别和缓存而变化cloudflare 配置的要求等。例如,我必须将站点收到的某些 wget 类型请求的 IP 列入白名单,这些请求在通过 cloudflare 传递时是合法的,但您必须是 cloudflare 帐户的管理员才能执行此操作。
如果您不是在谈论批量下载网站,您当然可以从 GUI 浏览器保存 html 源代码。
[检查,修改:]实际上,我刚刚测试过,wget 从 cloudflare 受保护的站点抓取了 html,但不确定,因为我可能被列入白名单,不记得了。但值得一试,递归 wget 站点下载可能会起作用,很难说,唯一知道的方法就是尝试。但是,有了额外的 blazingfast 层,这还取决于他们做什么、运行什么过滤器等,以及网站与该托管公司的服务级别等。但是,重复请求页面可能会导致 IP 阻止,唯一知道的方法就是测试它。
原始 wget 输出还将向您显示请求中发生的情况、响应代码等,这可能是有用的信息。
听起来 blazingfast 正在使用类似于 cloudflare 的高安全设置的东西,它设置一个 cookie,并且基本上需要一个 gui 浏览器,它是一个依赖于工作 gui 完整浏览器的节流阀,因此普通用户一旦浏览器执行了什么操作就可以访问该网站他们希望 GUI 浏览器能够做到这一点。我的猜测是,任何自动下载尝试,即使您在前几次文件抓取中取得了成功,也会触发自动 IP 块。
当然,您的问题真正要问的是如何绕过网站上的 DDOS 保护,这是很多恼怒的网站攻击者也想知道的。