我想镜像我的一个网站。
不幸的是,该网站在其预览模式,并且必须将 GET 参数附加到页面中的所有 URL,以便页面继续处于预览模式。
此 GET 参数是通过 JavaScript 添加的。显然,这并不影响wget
。
有没有办法可以将返回的 HTML 发送到脚本,以便在wget
尝试抓取所有 URL 之前自己添加这些内容?
我想镜像我的一个网站。
不幸的是,该网站在其预览模式,并且必须将 GET 参数附加到页面中的所有 URL,以便页面继续处于预览模式。
此 GET 参数是通过 JavaScript 添加的。显然,这并不影响wget
。
有没有办法可以将返回的 HTML 发送到脚本,以便在wget
尝试抓取所有 URL 之前自己添加这些内容?