可能重复:
如何下载整个网站
我读过的三个不同的博客最近宣布它们将停止运营并从网络上删除。虽然存档的页面在它们消失后可能会在 Google 的缓存中保留几周,并且一些页面会保留在 Way Back Machine 中,但我希望将这些网站存档到我的硬盘上以供将来参考。
最好的方法是什么?是否有任何软件可以将博客(例如 Blogspot)转换为按时间顺序排列的 PDF?
答案1
我将首先使用 WGET 来存档网站原样(以 html 格式),之后转换为 PDF 就很简单了。
看http://www.tufat.com/s_html2ps_html2pdf.htm和http://www.gnu.org/software/wget/