浏览已存档的网站

浏览已存档的网站

我的机器本地文件夹中存储有 html/网页文件。我可以使用任何浏览器正常查看这些内容。但是,从长远来看,我更希望将内容存储在某种存档格式(ZIP?)中。我可以这样做,每次想要查看页面时手动提取内容。但是,这有几个缺点。

如何在以下条件下查看存档文件内的 html/网页文件:

  1. 无需每次手动提取内容

  2. 内容不应提取到与档案相同的目录中 - 它应该放到其他地方,例如系统临时目录

  3. 不必为了查看几个页面而提取所有内容。我希望解决方案能够仅提取呈现当前正在查看的页面所需的内容

答案1

我能想到的满足您要求的一种方法是编写一个脚本来执行此操作。当您想查看存档中的页面时,请使用脚本打开它。

这样,您可以让脚本执行以下操作:

  • 创建临时文件夹
  • 读取HTML文件
  • 抓住所有需要的链接
  • 浏览它们并获取其余链接(如果有)
  • 从档案中创建结构
  • 将所需文件(从链接)提取到新创建的结构中
  • 显示页面
  • 关闭页面时删除临时文件夹

我知道这需要一点工作,但根据用途和必要性,它可能是值得的。

相关内容