如何 grep pdf 中的数学内容?

如何 grep pdf 中的数学内容?

有什么方法可以grep pdf文档(最初是用LaTeX编写的)来查找数学“2^n”,如2的n次方?我有 pdfgrep 但我不知道如何使用它来 grep 进行数学计算。

答案1

mutool clean -d您可以使用包中的egmupdf来解压缩PDF文件中的流,然后您可以查看它(或grep直接查看)。

不幸的是,PDF 文件中的文本是通过将字形(或字形序列)放置在预先计算的坐标处来呈现的。因此$2^n$和都$$2^n$$将由两个位于不同位置的2和字形组成n,这真的很难用正则表达式匹配。

我建议你解压你的pdf文档并看看文本渲染的实际情况。

相关内容