我经常利用离线时间(例如在汽车、火车或飞机上)阅读从网上获取的文章。为了存储内容,我目前使用 Firefox 的将页面另存为. (请注意不是递归下载整个网站,但仅下载单个页面及其样式、图像等)
我已经研究过如何自动化这个,但是 wget 和 HTTrack 都没有给我我需要的东西(要么太多要么太少 - 或者两者兼而有之)。
欢迎提出任何建议!
答案1
你有没有尝试过wget --page-requisites
?
This option causes Wget to download all the files that are neces‐
sary to properly display a given HTML page. This includes such
things as inlined images, sounds, and referenced stylesheets.
答案2
您应该使用 Firefox 扩展:ScrapBook https://addons.mozilla.org/en-US/firefox/addon/427
ScrapBook 是一款 Firefox 扩展程序,可帮助您保存网页并轻松管理收藏。其主要特点是轻便、快速、准确和支持多种语言。主要特点包括:
- 保存网页
- 保存网页片段
- 保存网站
- 以与书签相同的方式组织收藏
- 全文搜索和快速过滤搜索集合
- 编辑收集的网页
- 类似于 Opera Notes 的文本/HTML 编辑功能
答案3
没有脚本解决方案,但我使用剪贴簿存档网站以供日后阅读。这是一个很棒的扩展!
答案4
Firefox 可以使用“另存为 PDF”扩展程序来帮助完成此操作并节省一些工作。