我已经发布了非常相似的问题今天我想再次询问 wget/linux 的问题。希望这样没问题。
我需要在 LAMP 堆栈上以编程方式创建网页的离线副本,最好使用 PHP。我需要 HTML 源代码、附加图像和 CSS 样式表。
我可以在命令行上运行某些东西,但不能安装新的软件包。
我可以对要存档的页面执行操作wget --page-requisites
。这会下载我需要的所有内容,但不会修改下载的 HTML 和 CSS 文件以指向存档文件。
我正在寻找一个扩展/Perl 脚本/shell 脚本,用于修改下载的文档以指向下载的资源,或者可能是执行此操作的其他基于 Linux 的解决方案。我已经检查过了,httrack
似乎没有安装在服务器上(“whereis httrack”没有返回任何内容)。
答案1
尝试以下--convert-links
选项:
下载完成后,转换文档中的链接,使其适合本地查看。这不仅会影响可见的超链接,还会影响文档中链接到外部内容的任何部分,例如嵌入的图像、样式表链接、非 HTML 内容的超链接等。