wget - 在不同主机上镜像具有必需条件的完整网站

wget - 在不同主机上镜像具有必需条件的完整网站

我正在尝试制作 WordPress 网站的完整静态副本,无需wget任何网络连接即可浏览(所有链接和图像都必须转换)。

页面的不同必需条件(图像、CSS、JS...)位于 3 个不同的 Wordpress 主机上,并且始终位于相同的wp-content/uploads目录中。

我尝试将其他域上的递归限制为带有和 的wp-content/uploads目录,但我不能限制为仅获取和上的这些目录。--domains--include-directorieswget$URL1$URL2

这是命令行(不限于$URL0[$URL1|$URL2]/wp-content/uploads):

wget --convert-links --recursive -l inf -N -e robots=off -R -nc 
--default-page=index.html -E -D$URL1,$URL2,$URL0 --page-requisites 
-B$URL0 -X$URL1,$URL2 --cut-dirs=1 -I*/wp-content/uploads/*, -H -F $URL0

是否有可能将wget其他域上的递归限制为仅某些目录?

答案1

wget --mirror --convert-links yourdomain.com

答案2

您认为您可能正在寻找include_directories开关吗?

来自手动的:

'include_directories = list' '-I' 选项接受检索中包含的以逗号分隔的目录列表。任何其他目录都将被忽略。目录是绝对路径。因此,如果您希望从“http://host/people/bozo/”下载,仅通过链接到 /people 目录中的 bozo 同事和 /cgi-bin 中的虚假脚本,您可以指定:

          wget -I /people,/cgi-bin http://host/people/bozo/

相关内容