LaTeX 转换为纯文本,例如生成统计数据

LaTeX 转换为纯文本,例如生成统计数据

我想将大型 LaTeX 项目(即跨多个文件)转换为纯文本。目的是生成统计数据,因此表示数学不是问题。事实上,理想情况下,所有数学都被忽略了。

我已经发现http://code.google.com/p/textricks/但无法运行。它似乎尚未完成,但这正是我所寻找的。

答案1

我会将文档编译成 PDF,然后使用pdftotext它将其转换为文本文件。你应该禁用所有连字符并删除页眉(\pagestyle{empty})以仅获取原始文本。这可确保您使用的是 LaTeX 输出,而不是可能不同的输入。

当然,如果你想要统计 LaTeX 文件而不是由其生成的文档,那么你需要转换源文件。删除所有宏非常困难,因为 (La)TeX 非常动态,而且宏无论如何都可以重新定义(甚至由其本身定义)。因此,完全正确的删除只能在 (La)TeX 本身中实现,而且这仍然非常困难。有些工具可能只是删除所有宏和括号参数。这可能足以完成你的任务。

相关内容