如何在 Ubuntu 上将 html 书籍(由多个相互链接的 html 文件组成)转换为 pdf 文件?
希望生成的pdf文件能够根据html书籍的结构有书签。
html 书可以从以下位置下载这里。解压后进入help
,该目录manual
就是html书。
答案1
只需使用wkhtmltopdf
https://github.com/wkhtmltopdf
在我的软呢帽上:
- 通过安装
dnf install wkhtmltopdf
- 用于
wkhtmltopdf in.html out.pdf
答案2
首先,不确定我是否可以自动获取书签等,尽管那样就好了。
不过,您可以稍后手动添加它们。
尝试在 Firefox 中打开 HTML 文件,然后转到file -> print
(ctrl+p)
.然后,单击“打印到文件”并单击“PDF”。然后输入文件名并选择保存文件的文件夹。
如果你想自动化它,也许你想要wkhtml转pdf?要安装它(在 ubuntu 或 debian 或 linuxmint 或类似系统中),请输入:
sudo apt-get install wkhtmltopdf
答案3
您可以使用包html文档,这比 pandoc 更容易工作。它获取 html 文件列表并解析它们之间的超链接,以生成带有工作链接的单个 pdf,并包含图像。
htmldoc $(find help/manual -name '*html' | sort) --outfile /tmp/out.pdf
当然,了解以什么顺序整理 html 文件会有所帮助。我只是按名字对它们进行排序。
不幸的是,在我的 Fedora 20 上,当我尝试同时放入一半以上的 audacity 文件时,出现了核心转储。不过我的输出达到了 440 页。也许只是内存不够。 YMMV。
记住为了安全优先真正的大胆网站或您的操作系统包管理器而不是 sourceforge。
答案4
其他一些替代方案:
威易印刷- 比 wkhtmltopdf 之类的命令更更新、更好地支持打印 css 命令
分页js/pagedjs-cli- 相似的;在后端使用无头铬,但抽象化了一些困难
我推荐阅读本教程在 print-css.rocks 中,它总结了一堆方法。