如何使用正则表达式在 PDF 中搜索?

如何使用正则表达式在 PDF 中搜索?

通常我使用 Notepad++ 通过正则表达式在文件中搜索。今天我想知道是否有 PDF 程序可以对 PDF 执行相同的操作。当然我可以将 PDF 转换为文本并使用 Notepad++,但有没有更简单的方法而无需转换?

答案1

几个选项:

答案2

  1. Agent Ransack 是免费的(精简版)并且支持 PDF,正如其发布说明所确认的那样。
  2. PowerGREP 是一种商业产品。

正如您所说,明显的替代方法是将 PDF 转换为文本。程序员设置批量处理的一种方法是使用 Python 包 PDFMiner。Agent Ransack 使用 Xpdf 项目中的“pdftotext”(您也可以)。

相关内容