我知道wget
可以获取远程页面及其依赖项并重写 html,以便图像src
属性引用新下载的图像。
我正在尝试转换引用互联网上图片的本地 html 文件。我正在使用
wget --mirror --page-requisites --convert-links \
--directory-prefix=foo \
--force-html \
--input-file=my_file.html
所有引用的图像都下载到适当的位置,foo/
但src
属性my_file.html
并没有改变。
答案1
尝试这个:
wget --recursive --page-requisites --html-extension=on --convert-links="on" --domains="www.thesite.com" --no-parent http://www.thesite.com
这将为您带来本地的整个网站。刚刚尝试过,运行良好。
使用本地资源