我正在尝试使用 来镜像博客,www.example.com
例如wget
。
我使用 wget 和以下选项(shell 变量被正确替换):
wget -m -p -H -k -E -np \
-w 1 \
--random-wait \
--restrict-file-names=windows \
-P $folder \
-Q${quota}m \
-t 3 \
--referer=$url \
-U 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.6) Gecko/20070802 SeaMonkey/1.1.4' \
-e robots=off \
-D $domains
-- $url
该博客包含位于其他域的图像。
即使我已经指定了-p
选项(下载链接页面资产),除非我在选项中明确指定每个域,否则不会下载这些图像-D
。
如果我省略该-D
选项,那么 wget 将跟踪外部的每个链接www.example.com
并下载整个互联网。
是否可以wget
只关注下面每个链接www.example.com
并下载每个页面所需的资产,无论这些资产是否位于同一个域中,而不需要我明确指定每个域?
答案1
不,唯一的方法是使用 -D 或 --domains=[domain list](以逗号分隔列表的形式)指定您希望 wget 关注的域