如何使用 LaTeX 打印或将 HTML 文档转换为 PDF

如何使用 LaTeX 打印或将 HTML 文档转换为 PDF

我编写了一个 XSD 模式,并使用 xmlpad 记录了该模式,它会自动为该 XSD 模式生成 HTML 文档。现在我想为该 HTML 文档生成 PDF 文档。我想将 HTML 文档转换为 LaTeX,并使用它pdflatex生成 PDF 文档。但我不知道如何将 HTML 文档转换为 LaTeX?有没有开源工具?有人可以推荐一种工具或其他方法吗?我需要将 HTML 文档转换为 PDF。

答案1

我不知道 LaTeX,但使用 ConTeXt MkIV,你可以解析 XML。有关解析 HTML 的示例,请参阅我的方式作者:托马斯·施密茨

答案2

您可以使用 pandoc 将 HTML 转换为 LaTeX,然后从输出中生成 PDF。

答案3

感谢来自的解决方案直接融资!这是根据他的建议。

您可以直接使用pandoc将 HTML 转换为 PDF,例如将 google-cpp-styleguide.html 转换为 PDF 文档:

pandoc cppguide.html -o cppguide.pdf

但是,我更喜欢先通过 转换为 LaTeX pandoc,然后编辑.tex文件以满足我的需求(因为上面生成的默认 PDF 是使用articleLaTeX 中的类,所以我更喜欢调整页面布局以节省纸张)。例如,

pandoc -s cppguide.html -o cppguide.tex

然后使用你最喜欢的 LaTeX(例如奥科特克斯)根据需要进行编辑,然后pdflatex就可以了。

參閱http://pandoc.org/demos.html用于 pandoc 使用演示。

相关内容