如何将 PDF 转换为 (La)TeX?

如何将 PDF 转换为 (La)TeX?

我知道在编译 .tex 文件时几乎没有任何信息传递给 PDF。

但是有没有工具可以将 PDF 文档转换回 (La)TeX?

答案1

如果您安装艾比词使用附加的导入和导出插件*,您可以在文字处理器中打开 PDF 文件,然后导出为 LaTeX。事实上,您也可以从命令行进行转换:

abiword --to=tex filename.pdf

请注意,无论是 PDF 导入程序还是 LaTeX 导出程序都存在严重的局限性,您不应期望任何东西在事后不经过认真的调整就能使用。

(* IIRC,额外的插件是通过在 Windows 上选择自定义安装并检查它提供的所有导入和导出选项来安装的。对于 Linux,通常需要根据发行版安装一个名为“abiword-plugins”或“abiword-plugin-mathview”的单独软件包。对于 Mac 则没有线索。)

Inkscape可以打开 PDF 并导出为 PSTricks 或 TikZ 代码;如果所讨论的 PDF 只是您想要编辑的图表或矢量图像,这可能会很有用。

sourceforge 上列出的一个名为 pdf2latex 的项目,但看起来似乎没有进行任何实际工作。我不确定这是一个真正的项目。(该页面看起来很可疑;几乎就像有人只是在发布一个想法。)

答案2

查看英特阅读器

引用开始页:

InftyReader 是一个光学字符识别 (OCR) 应用程序,可以识别科学文档(包括数学符号)并将其翻译为 LaTeX、MathML 和 XHTML!

答案3

我没有找到可以处理格式化的工具,但对于在 Linux 上提取文本,有两步程序可以产生良好的结果:

$ pdf2ps paper.pdf
$ ps2ascii paper.ps > paper.txt

从:https://texfaq.org/FAQ-recovertex

答案4

使用 LibreOffice 导入文件。它将创建一个 Draw 文件。您必须将其逐段复制并编辑到 Writer 中。然后您可以使用插件writer2latex将结果导出到 LaTeX。最终的代码很脏,包含大量您不需要的内容和一些错误。

如果您的文档足够大,这个过程可能比重新输入所有内容更容易。

如果您主要处理纯文本和简单文本,另一种方法是将文件另存为*.txtPDF 阅读器中的文件。然后将内容复制/粘贴到 LaTeX 编辑器中。

相关内容