我想使用 wget 镜像一个网站,并将所有链接转换为我已下载的本地副本。到目前为止,这很容易,我所要做的就是wget -mk http://site.com
但是所有静态媒体都位于不同的域中,如果我使用该-H
选项跟踪所有外部主机,它将下载静态媒体文件,但也会下载其他外部链接的内容。
有没有办法指定‘仅下载列表 X 中指定的外部主机’?
答案1
添加 -Dwww.domain.com,static.domain.com 和您的等效域名。
答案2
请参阅 wget 手册页中该选项后面的部分 --page-requisites
,其中有一个示例:
该页面指向外部文档的链接不会被跟踪。实际上,为了下载单个页面及其所有必需项(即使它们存在于不同的网站上),并确保这些内容在本地正确显示,除了 -p 之外,作者还喜欢使用一些选项:
wget -E -H -k -K -p http://<site>/<document>