我有一个 Google Code 项目,其中包含大量 wiki 文档。我想创建此文档的副本以供离线浏览。我想使用wget
或类似的实用程序。
我尝试了以下方法:
$ wget --no-parent \
--recursive \
--page-requisites \
--html-extension \
--base="http://code.google.com/p/myProject/" \
"http://code.google.com/p/myProject/"
问题是镜像副本内的链接有如下链接:
file:///p/myProject/documentName
以这种方式重命名链接会导致 404(未找到)错误,因为链接指向文件系统上无效的位置。
我应该使用哪些选项来代替wget
,以便我可以制作网站文档和其他页面的本地副本?
答案1
如果 URL 如下所示:
https://code.google.com/p/projectName/downloads/detail?name=yourFILE.tar.gz
将其变成:
$wget https://projectName.googlecode.com/files/yourFILE.tar.gz
这对我来说很好。
答案2
经过多次尝试后,我终于让以下方法对我有用:
$ wget --no-parent \
--recursive \
--page-requisites \
--html-extension \
--convert-links \
-E -l 3 \
http://code.google.com/p/myProject/
现在,结果已经完全独立了。