我在使用 Pandoc 将 Wikipedia 页面转换为 PDF 时遇到问题。Pandoc 尝试通过 LaTeX 将网页转换为 PDF 格式,而我遇到的问题似乎与 LaTeX 有关,这就是我在这里提出问题的原因。以下是我正在尝试执行的操作:
pandoc -s --latex-engine=xelatex -r html http://en.wikipedia.org/wiki/Wikipedia_talk:Manual_of_Style/Dates_and_numbers/Archive_142 -o archive_142.pdf
我在 Ubuntu 上设置的一些先决条件如下:
sudo apt-get -y install texlive-latex-recommended texlive-fonts-recommended texlive-xetex texlive-latex-extra
当我尝试执行此操作时,终端输出如下:
pandoc: Could not find image `//upload.wikimedia.org/wikipedia/en/thumb/2/2a/Replacement_filing_cabinet.svg/40px-Replacement_filing_cabinet.svg.png', skipping...
pandoc: Could not find image `//upload.wikimedia.org/wikipedia/commons/thumb/4/41/Symbol_confirmed.svg/20px-Symbol_confirmed.svg.png', skipping...
pandoc: Could not find image `//upload.wikimedia.org/wikipedia/commons/thumb/4/41/Symbol_confirmed.svg/20px-Symbol_confirmed.svg.png', skipping...
pandoc: Could not find image `//en.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1', skipping...
pandoc: Could not find image `//bits.wikimedia.org/images/wikimedia-button.png', skipping...
pandoc: Could not find image `//bits.wikimedia.org/static-1.24wmf2/skins/common/images/poweredby_mediawiki_88x31.png', skipping...
pandoc: Error producing PDF from TeX source.
! Unable to load picture or PDF file '//upload.wikimedia.org/wikipedia/en/thumb
/2/2a/Replacement_filing_cabinet.svg/40px-Replacement_filing_cabinet.svg.png'.
<to be read again>
}
l.92 ...g/40px-Replacement_filing_cabinet.svg.png}
未生成所需的 PDF 文件。您知道如何解决此问题吗?
答案1
$ pandoc -s -S -t latex --latex-engine=xelatex -r html http://en.wikipedia.org/wiki/Wikipedia_talk:Manual_of_Style/Dates_and_numbers/Archive_142 > archive142.tex
$ xelatex archive142.tex
当出现第一条错误消息时按下S
。这将生成不包含图像的 PDF。