我读过以下讨论如何从 archive.org Wayback Machine 下载网站?并按照说明进行操作https://github.com/hartator/wayback-machine-downloader 安装 wayback_machine_downloader 并使用它从 archive.org 成功下载了一个网站。
有没有办法浏览这些页面,以便单击链接即可进入相应的离线页面,而不是尝试在线打开实时页面?
答案1
如果您使用的程序没有自动为您重写 URL,那么您可以有两个基本选择……
第一种选择是创建一个个人服务器来镜像你下载的内容。你可以设置一个网络服务器,例如阿帕奇或者Nginx(或者另一种选择),然后创建至少一个相应的虚拟主机过期域名。此主机(或主机)将存放您下载的文件。您需要某种形式的DNS解决方案将旧域名映射到本地 Web 服务器,但这可能可以通过您的hosts 文件或者甚至完整的本地 DNS 设置绑定或者类似软件。
如果上述解决方案不理想,你可能需要自己重写 URL。当然,你可以手动完成,但(取决于项目的大小)你可能需要查看Python脚本语言和一个名为美丽汤。Beautiful soup 用于解析网页,并且可以重写链接(假设您编写了脚本来执行此操作)。
需要注意的是,无论你选择哪种方法,你仍可能需要查看 HTML 源代码来确定哪些链接需要注意,哪些不需要。记住,外部链接无论如何都可能无法正常工作,前提是 archive.org 也没有复制该内容。