将 html 书籍转换为 pdf 文件?

将 html 书籍转换为 pdf 文件?

如何在 Ubuntu 上将 html 书籍(由多个相互链接的 html 文件组成)转换为 pdf 文件?

希望生成的pdf文件能够根据html书籍的结构有书签。

html 书可以从以下位置下载这里。解压后进入help,该目录manual就是html书。

答案1

只需使用wkhtmltopdf

https://github.com/wkhtmltopdf

在我的软呢帽上:

  • 通过安装
    dnf install wkhtmltopdf 
    
  • 用于
    wkhtmltopdf in.html out.pdf
    

答案2

首先,不确定我是否可以自动获取书签等,尽管那样就好了。

不过,您可以稍后手动添加它们。

尝试在 Firefox 中打开 HTML 文件,然后转到file -> print (ctrl+p).然后,单击“打印到文件”并单击“PDF”。然后输入文件名并选择保存文件的文件夹。

在此输入图像描述

如果你想自动化它,也许你想要wkhtml转pdf?要安装它(在 ubuntu 或 debian 或 linuxmint 或类似系统中),请输入:
sudo apt-get install wkhtmltopdf

答案3

您可以使用包html文档,这比 pandoc 更容易工作。它获取 html 文件列表并解析它们之间的超链接,以生成带有工作链接的单个 pdf,并包含图像。

htmldoc $(find help/manual -name '*html' | sort) --outfile  /tmp/out.pdf

当然,了解以什么顺序整理 html 文件会有所帮助。我只是按名字对它们进行排序。

不幸的是,在我的 Fedora 20 上,当我尝试同时放入一半以上的 audacity 文件时,出现了核心转储。不过我的输出达到了 440 页。也许只是内存不够。 YMMV。

记住为了安全优先真正的大胆网站或您的操作系统包管理器而不是 sourceforge。

答案4

其他一些替代方案:

威易印刷- 比 wkhtmltopdf 之类的命令更更新、更好地支持打印 css 命令

分页js/pagedjs-cli- 相似的;在后端使用无头铬,但抽象化了一些困难

我推荐阅读本教程在 print-css.rocks 中,它总结了一堆方法。

相关内容