正则表达式 PDF 搜索?

正则表达式 PDF 搜索?

我是一名电子工程师,我经常查看 PDF 原理图。我经常遇到这样的情况:我想在原理图中搜索某个元件,例如“R1”

问题是搜索“R1”也会匹配原理图上的所有 R[tens] 和 R[hundreds]。因此我希望能够在搜索中使用正则表达式,或者至少对搜索进行更严格的控制(例如,仅搜索整个单词)。

这里有没有人找到过 Ubuntu 上支持这些功能的优秀 PDF 工具?

答案1

安装pdfgrep

sudo apt-get install pdfgrep

然后使用-C选项和字边界匹配:

pdfgrep -C 0 '\<WORD\>' file.pdf

或使用\b...\b代替\<...\>

参见人pdfgrep

-C, --context NUM
      Print at most NUM characters of context around each match.

我在谷歌上搜索并发现JPedal(30 天试用版).通过以下命令通过命令行下载并打开它:

java -jar jpedal-trial.jar

现在按Ctrl+ F,输入要搜索的单词,然后从向下箭头图标 ( 在此处输入图片描述) 中选中“仅查找全词”以搜索全词。

在此处输入图片描述

答案2

如果你愿意创建文档索引,你可以使用雷科尔这是一款功能齐全的桌面搜索引擎。有关屏幕截图和安装说明,请查看这个答案

Recoll 搜索使用强大的查询语言支持通配符修饰符(例如接近松弛)。

例如,查询"R1"l将只产生全词结果。这是因为l修饰符关闭了词干提取。(在这个特定示例中,您甚至不需要修饰符,因为 Recoll 默认不扩展数字序列)。

答案3

如果问题只是将搜索限制为整个单词,那很容易。只需在搜索字符串前后添加空格,如下所示:" R1 "。我在 Evince 中一直使用这个技巧。

相关内容