使用 wget 镜像站点并下载静态媒体

使用 wget 镜像站点并下载静态媒体

我想使用 wget 镜像一个网站,并将所有链接转换为我已下载的本地副本。到目前为止,这很容易,我所要做的就是wget -mk http://site.com

但是所有静态媒体都位于不同的域中,如果我使用该-H选项跟踪所有外部主机,它将下载静态媒体文件,但也会下载其他外部链接的内容。

有没有办法指定‘仅下载列表 X 中指定的外部主机’?

答案1

添加 -Dwww.domain.com,static.domain.com 和您的等效域名。

答案2

请参阅 wget 手册页中该选项后面的部分 --page-requisites,其中有一个示例:

该页面指向外部文档的链接不会被跟踪。实际上,为了下载单个页面及其所有必需项(即使它们存在于不同的网站上),并确保这些内容在本地正确显示,除了 -p 之外,作者还喜欢使用一些选项:

wget -E -H -k -K -p http://<site>/<document>

相关内容