存档(蜘蛛)即将被删除的网站的最佳方法是什么?

存档(蜘蛛)即将被删除的网站的最佳方法是什么?

可能重复:
如何下载整个网站

我读过的三个不同的博客最近宣布它们将停止运营并从网络上删除。虽然存档的页面在它们消失后可能会在 Google 的缓存中保留几周,并且一些页面会保留在 Way Back Machine 中,但我希望将这些网站存档到我的硬盘上以供将来参考。

最好的方法是什么?是否有任何软件可以将博客(例如 Blogspot)转换为按时间顺序排列的 PDF?

答案1

我将首先使用 WGET 来存档网站原样(以 html 格式),之后转换为 PDF 就很简单了。

http://www.tufat.com/s_html2ps_html2pdf.htmhttp://www.gnu.org/software/wget/

相关内容