通常我使用 Notepad++ 通过正则表达式在文件中搜索。今天我想知道是否有 PDF 程序可以对 PDF 执行相同的操作。当然我可以将 PDF 转换为文本并使用 Notepad++,但有没有更简单的方法而无需转换?
答案1
几个选项:
- 特工搜捕(最佳答案不使用索引服务的情况下*自信地*搜索 Windows 中的文件和内容的最佳方法是什么?)
- 数据库管理工具这是一款免费开源软件。遗憾的是,目前它仅适用于 Windows。(已为其他平台开放功能请求这里)
答案2
- Agent Ransack 是免费的(精简版)并且支持 PDF,正如其发布说明所确认的那样。
- PowerGREP 是一种商业产品。
正如您所说,明显的替代方法是将 PDF 转换为文本。程序员设置批量处理的一种方法是使用 Python 包 PDFMiner。Agent Ransack 使用 Xpdf 项目中的“pdftotext”(您也可以)。