下载包含令牌查询字符串的 URL

下载包含令牌查询字符串的 URL

为了解释我想要什么,我将举一个例子(对不起,我的外国朋友是阿拉伯语而不是英语:D)。

让我们拿这个网址例如。当您打开它时,5 秒计时器后会出现一个蓝色方块。在按下这个蓝色按钮之前,如果您使用浏览器检查它,您会注意到href该按钮的 URL 是相同的 URL,后跟一个查询?pt=,该查询似乎是每次生成的某种令牌。

如果您遵循此 URL(通过按按钮或复制/粘贴 URL),它将引导您进入一个页面,然后再次检查该页面,更具体地说,检查一个写为 (T) 的元素,其中href包含相同的内容网址但后面跟着一个查询“download_token”,该查询是在您每次请求该页面时生成的。

现在你可以获得原版了网址通过wget一些解析,您可以获得内部 URL(带有查询的 URL ?pt=),但是通过解析传递结果 URL 将获得原始 URL网址不是包含以下内容的页面download_token

  • 我尝试过wget并且curl
  • 我尝试在单引号和双引号中传递 URL
  • 第一个标记包含%XXASCII 的十六进制表示。我用相应的字符替换了它们,但它不起作用。

如何制作wgetcurl任何其他类似实用程序来下载动态查询后的 URL?似乎它解析 URL 时有?pt=某种错误,可能是由于十六进制字符? URL 可以download_token很好地工作wget(至少在几次试验中)。

我做这一切的目的是使其余 1200 多个链接的类似过程自动化。

相关内容