不使用带宽从本地主机递归获取网站

不使用带宽从本地主机递归获取网站

我希望使用 wget 将我的 wordpress 网站递归下载为静态,问题是每当我这样做时,它都会使用太多带宽(3.5gb),即使我最终下载了 20mb,这很奇怪,所以我希望使用 localhost 下载,但是当我将 wget 与 localhost 一起使用时,我只获得索引页,现在,我们都知道 wordpress 将网站网址保存到数据库中,所以我应该如何使用 localhost 下载,我已经在 apache 配置中设置它,我只是想在不使用那么多带宽的情况下下载。

尝试使用 -N 选项来减少带宽,但我不断收到错误,提示文件没有最后修改的标头,因此它没有帮助。

这是我正在使用的命令:

wget -N     --recursive      --no-clobber      --page-requisites      --html-extension      --convert-links      --restrict-file-names=windows      --domains website website -P /opt/

谢谢你,

更新 1:使用 /etc/hosts 并将网站链接到本地​​主机 ip 127.0.0.1,但它仍然重定向回原始 ip,并且只下载 index.page。

有没有办法告诉服务器强制将最后修改的标头添加到所有 wordpress 文件?

答案1

您不应该使用该--page-requisites选项。

此选项使 wget 下载每个页面的所有图像、CSS、脚本等,包括来自外部网站的内容。对于您的情况,这不是必需的,因为所有内部文件都已经下载了。


您还应该考虑一些更合理的方式来导出您的网站。如果您希望它永远保持静态,并且您永远不会再更改它(这不太可能!)那么这种方法很好。但请考虑将其导出为适合导入静态网站生成器(如 hugo 或 jekyll)的格式。通过这种方法,您可以拥有静态网页,但仍然可以在以后需要时维护它们。

相关内容