当我想搜索一个片段时,比如searchPart1 一些未知的文本 searchPart2在文本文件中,我使用 searchPart1.*searchPart2
。但这在我使用的任何 pdf 阅读器中都是不可能的。目前,我将 pdf 转换为文本文件并使用less
或打开它geany
,然后使用其上可用的正则表达式。
除了命令行之外,是否有带有正则表达式搜索的 PDF 阅读器pdfgrep
答案1
pdfgrep在 repos 中,并不是一个真正的阅读器,需要使用终端,但它消除了先将 pdf 文件转换为文本文件,然后在有能力的文本编辑器中打开它的需要:
除了 Synaptic 中列出的功能外,您还可以搜索多个文件并进行递归搜索。与常规搜索的一个很大的区别grep
是 pdfgrep 不提供行号,而是提供页码。man pdfgrep
有详细信息。
一个简单的例子:
pdfgrep -in PATTERN FILENAME
这里,i
不区分大小写,n
给出页码,不是电话号码。
输出示例如下:
YouTube 上有一段简短的视频,Pdfgrep - 在 PDF 文件中搜索文本 - Linux CLI,也一样。