我想递归镜像网页,但它使用 javascript 链接,例如"javascript:readArticle(x)"
。我知道这样的链接只是转换成 URL,比如说"/articles/read?id=x"
,我可以告诉 wget 在继续下载之前“翻译”这些链接吗?
我是不是建议 wget 应该解释 javascript。
有没有办法让 wget 下载一个页面,更改这些链接(也许使用sed
?),然后按照新的链接恢复下载?
我想递归镜像网页,但它使用 javascript 链接,例如"javascript:readArticle(x)"
。我知道这样的链接只是转换成 URL,比如说"/articles/read?id=x"
,我可以告诉 wget 在继续下载之前“翻译”这些链接吗?
我是不是建议 wget 应该解释 javascript。
有没有办法让 wget 下载一个页面,更改这些链接(也许使用sed
?),然后按照新的链接恢复下载?