如何使用 wget 获取 Google Code 网站文档的副本?

如何使用 wget 获取 Google Code 网站文档的副本?

我有一个 Google Code 项目,其中包含大量 wiki 文档。我想创建此文档的副本以供离线浏览。我想使用wget或类似的实用程序。

我尝试了以下方法:

$ wget --no-parent \
       --recursive \
       --page-requisites \
       --html-extension \
       --base="http://code.google.com/p/myProject/" \
       "http://code.google.com/p/myProject/"

问题是镜像副本内的链接有如下链接:

file:///p/myProject/documentName

以这种方式重命名链接会导致 404(未找到)错误,因为链接指向文件系统上无效的位置。

我应该使用哪些选项来代替wget,以便我可以制作网站文档和其他页面的本地副本?

答案1

如果 URL 如下所示:

https://code.google.com/p/projectName/downloads/detail?name=yourFILE.tar.gz

将其变成:

$wget https://projectName.googlecode.com/files/yourFILE.tar.gz

这对我来说很好。

答案2

经过多次尝试后,我终于让以下方法对我有用:

$ wget --no-parent \
       --recursive \
       --page-requisites \
       --html-extension \
       --convert-links \ 
       -E -l 3 \
       http://code.google.com/p/myProject/

现在,结果已经完全独立了。

相关内容