我正在尝试制作 WordPress 网站的完整静态副本,无需wget
任何网络连接即可浏览(所有链接和图像都必须转换)。
页面的不同必需条件(图像、CSS、JS...)位于 3 个不同的 Wordpress 主机上,并且始终位于相同的wp-content/uploads
目录中。
我尝试将其他域上的递归限制为带有和 的wp-content/uploads
目录,但我不能限制为仅获取和上的这些目录。--domains
--include-directories
wget
$URL1
$URL2
这是命令行(不限于$URL0
和[$URL1|$URL2]/wp-content/uploads
):
wget --convert-links --recursive -l inf -N -e robots=off -R -nc
--default-page=index.html -E -D$URL1,$URL2,$URL0 --page-requisites
-B$URL0 -X$URL1,$URL2 --cut-dirs=1 -I*/wp-content/uploads/*, -H -F $URL0
是否有可能将wget
其他域上的递归限制为仅某些目录?
答案1
wget --mirror --convert-links yourdomain.com
答案2
您认为您可能正在寻找include_directories
开关吗?
来自手动的:
'include_directories = list' '-I' 选项接受检索中包含的以逗号分隔的目录列表。任何其他目录都将被忽略。目录是绝对路径。因此,如果您希望从“http://host/people/bozo/”下载,仅通过链接到 /people 目录中的 bozo 同事和 /cgi-bin 中的虚假脚本,您可以指定:
wget -I /people,/cgi-bin http://host/people/bozo/