我的机器本地文件夹中存储有 html/网页文件。我可以使用任何浏览器正常查看这些内容。但是,从长远来看,我更希望将内容存储在某种存档格式(ZIP?)中。我可以这样做,每次想要查看页面时手动提取内容。但是,这有几个缺点。
如何在以下条件下查看存档文件内的 html/网页文件:
无需每次手动提取内容
内容不应提取到与档案相同的目录中 - 它应该放到其他地方,例如系统临时目录
不必为了查看几个页面而提取所有内容。我希望解决方案能够仅提取呈现当前正在查看的页面所需的内容
答案1
我能想到的满足您要求的一种方法是编写一个脚本来执行此操作。当您想查看存档中的页面时,请使用脚本打开它。
这样,您可以让脚本执行以下操作:
- 创建临时文件夹
- 读取
HTML
文件 - 抓住所有需要的链接
- 浏览它们并获取其余链接(如果有)
- 从档案中创建结构
- 将所需文件(从链接)提取到新创建的结构中
- 显示页面
- 关闭页面时删除临时文件夹
我知道这需要一点工作,但根据用途和必要性,它可能是值得的。