将一堆 HTML 压缩为一个 PDF

将一堆 HTML 压缩为一个 PDF

我有很多 HTML 文件(网页,使用 FireFox 保存为一个<filename>.html文件和一个<filename>_files包含静态内容的目录)。如何仅使用 Linux 命令行将它们压缩为一个大型 PDF 文件?

注意:每个文件都有自己的编码。例如,一些文件可能使用 UTF-8 编码,而其他文件则使用 latin-1 编码。

我找到了这个htmldoc实用程序,但它不支持 UTF-8 编码(至少 apt-get repos 中的版本不支持)。所以问题变成了这样:

我怎样才能(无论是否更改文件的编码)将它们压缩为一个大的 PDF 文件?

答案1

  1. 使用iconv从 UTF-8 转换编码
  2. 使用htmldoc将 HTML 转换为 PDF
  3. 使用pdftk合并 PDF

相关内容