我使用 ghostscript 命令将目录中的所有 pdf 文件合并为一个大约八十页的文件。当我使用 evince 搜索字符串时,它会告诉我找到该字符串的次数就在该页面上。如果我继续点击下一步,它将带我到后面的页面。evince 中是否有一个设置可以更改,以便它会找到每一个pdf 中出现字符串,而您无需帮助它?如果没有,是否有更好的 Linux 版 pdf 查看器或命令行工具可以做到这一点(至少告诉我该术语出现在哪些页码上)
答案1
至少有两个选项可以在命令行上搜索 pdf:
- 使用工具pdfgrep,其功能与名称所示一致。它与 GNU grep 兼容,但适用于 pdf 文件。
pdfgrep 'pattern' yourfile.pdf
- 使用
pdftotext
frompoppler-utils
(Ubuntu 桌面上应该默认安装),将其转换为纯文本文件并使用标准 grep:
pdftotext yourfile.pdf - | grep 'pattern'