有没有办法将大型 html 文件(顺便说一下,用 sphinx 生成)转换为具有颜色、目录(toc)和 unicode 支持的 pdf?
有htmldoc
——但是它既不支持颜色,也不支持unicode。
有rst2pdf
sphinx 插件 —— 但目前它会破坏数学渲染,也无法对代码行进行文字扭曲。
有一种方法可以导出到xetex
——sphinx
但它不能自动换行代码块,也不支持svg
图像。
编辑:
我尝试使用pandoc
:
pandoc index.html --mathjax --toc -o index.pdf
它给:
pandoc: Error producing PDF from TeX source.
! LaTeX Error: Command \guillemotright unavailable in encoding OT1.
See the LaTeX manual or LaTeX Companion for explanation.
Type H <return> for immediate help.
...
l.55 2012-Sep-11} »
我被困住了……
答案1
答案2
如果您使用的是 Linux 或 Mac,您可以尝试html2pdf
或html2ps foo.html; ps2pdf foo.ps
。这两种方法都不完美,但它们可能有效。
您也可以尝试在办公套件中打开文件并导出为 pdf。我知道 word 和 libreoffice 都支持此功能。如果您使用的是 Windows,这是我所知道的唯一选项。
最好的方法是将文件导出为 TeX 或 LaTeX 并编译 pdf,您可以编辑 LaTeX 代码来修复任何换行问题。您还可以使用convert
ImageMagick 轻松将图像转换为 png:
$ mogrify -format png *.svg
答案3
将页面打印为 PDFFirefox 插件确实创建了一个目录。