如何在 pdfgrep 中查找包含 2 个字符串的 pdf 文件?

如何在 pdfgrep 中查找包含 2 个字符串的 pdf 文件?

pdfgrep在 Fedora 25 中使用,我需要找到包含“仅”两个字符串的 pdf 文件:我尝试过这样做,但我认为这是错误的:

pdfgrep -HiRn 'string 1|string 2' .

这个命令该如何修改呢?

答案1

您的命令看起来不错。问题可能出在管道符号 上|。标准grep不会在不转义的情况下处理它。由于man的页面pdfgrep说“pdfgrep 的工作方式与 grep 非常相似”,因此它可能受到相同的语法限制。

为了使其工作,您将需要逃避|这样的事情\|

pdfgrep -HiRn 'string 1\|string 2' .

答案2

我按照 Chindraba 的建议尝试了一下,但 pdfgrep 对我来说不起作用。这个对我有用:

pdfgrep -ril -e "search term 1" -e "search term 2" >matches.txt 2>badfiles.txt

相关内容