在长 pdf 的所有页面中搜索字符串

在长 pdf 的所有页面中搜索字符串

我使用 ghostscript 命令将目录中的所有 pdf 文件合并为一个大约八十页的文件。当我使用 evince 搜索字符串时,它会告诉我找到该字符串的次数就在该页面上。如果我继续点击下一步,它将带我到后面的页面。evince 中是否有一个设置可以更改,以便它会找到每一个pdf 中出现字符串,而您无需帮助它?如果没有,是否有更好的 Linux 版 pdf 查看器或命令行工具可以做到这一点(至少告诉我该术语出现在哪些页码上)

答案1

至少有两个选项可以在命令行上搜索 pdf:

  1. 使用工具pdfgrep,其功能与名称所示一致。它与 GNU grep 兼容,但适用于 pdf 文件。
pdfgrep 'pattern' yourfile.pdf 
  1. 使用pdftotextfrom poppler-utils(Ubuntu 桌面上应该默认安装),将其转换为纯文本文件并使用标准 grep:
pdftotext yourfile.pdf - | grep 'pattern'

相关内容