从网站 HTML 页面生成单个 PDF

从网站 HTML 页面生成单个 PDF

问题是这样的:我经常需要参考一个网站,并且想要一个也可以在移动设备上使用的离线版本,我想到的是 PDF。

我可以使用 wget 制作 HTML 版本的离线副本,这不是问题。

我真正想要的是将所有 HTML 页面转换为单个 PDF 的方法,同时内部链接仍然有效。因此,原本指向网页版其他 URL 的链接应该指向 PDF 中的相应页面。

理想情况下,还应该有一种方法来生成目录并放入 PDF 中。

我怎样才能实现这个目标?

也欢迎 Bash/Python/ruby/whatever 脚本和其他命令行内容。

(顺便说一下,我使用的是 OSX 10.9。)

答案1

你应该看看转PDF,这是一款免费工具,从其宣传的高级功能列表来看,手册页,至少应该大致能让你满意:

将多个 HTML 文档打印为一个 PDF 文件。

无需 X11 服务器即可运行。

向 PDF 文件添加文档大纲。

向 PDF 文件添加页眉和页脚。

生成目录。

在生成的 PDF 文件中添加链接。

使用丝网介质类型进行打印。

禁用webkit的智能收缩功能。

相关内容