为了解释我想要什么,我将举一个例子(对不起,我的外国朋友是阿拉伯语而不是英语:D)。
让我们拿这个网址例如。当您打开它时,5 秒计时器后会出现一个蓝色方块。在按下这个蓝色按钮之前,如果您使用浏览器检查它,您会注意到href
该按钮的 URL 是相同的 URL,后跟一个查询?pt=
,该查询似乎是每次生成的某种令牌。
如果您遵循此 URL(通过按按钮或复制/粘贴 URL),它将引导您进入一个页面,然后再次检查该页面,更具体地说,检查一个写为 (T) 的元素,其中href
包含相同的内容网址但后面跟着一个查询“download_token”,该查询是在您每次请求该页面时生成的。
现在你可以获得原版了网址通过wget
一些解析,您可以获得内部 URL(带有查询的 URL ?pt=
),但是通过解析传递结果 URL 将获得原始 URL网址不是包含以下内容的页面download_token
- 我尝试过
wget
并且curl
- 我尝试在单引号和双引号中传递 URL
- 第一个标记包含
%XX
ASCII 的十六进制表示。我用相应的字符替换了它们,但它不起作用。
如何制作wget
或curl
任何其他类似实用程序来下载动态查询后的 URL?似乎它解析 URL 时有?pt=
某种错误,可能是由于十六进制字符? URL 可以download_token
很好地工作wget
(至少在几次试验中)。
我做这一切的目的是使其余 1200 多个链接的类似过程自动化。