有什么方法可以grep pdf文档(最初是用LaTeX编写的)来查找数学“2^n”,如2的n次方?我有 pdfgrep 但我不知道如何使用它来 grep 进行数学计算。
答案1
mutool clean -d
您可以使用包中的egmupdf
来解压缩PDF文件中的流,然后您可以查看它(或grep
直接查看)。
不幸的是,PDF 文件中的文本是通过将字形(或字形序列)放置在预先计算的坐标处来呈现的。因此$2^n$
和都$$2^n$$
将由两个位于不同位置的2
和字形组成n
,这真的很难用正则表达式匹配。
我建议你解压你的pdf文档并看看文本渲染的实际情况。