在注释的 PDF 文件中搜索文本字符串
由于不仅需要在 PDF 文件正文中搜索文本字符串,还需要在评论中搜索文本字符串,因此我在 Ubuntu 18.04 LTS 上安装了 Acrobat Reader。它的搜索功能可以正常工作,但我想知道是否还有其他方法可以完成该任务(pdfgrep?) ...
由于不仅需要在 PDF 文件正文中搜索文本字符串,还需要在评论中搜索文本字符串,因此我在 Ubuntu 18.04 LTS 上安装了 Acrobat Reader。它的搜索功能可以正常工作,但我想知道是否还有其他方法可以完成该任务(pdfgrep?) ...
现在是印度的入学时间,我正在尽最大努力考入最好的工程学院。 我有一个 pdf 文件,其中包含一个表格,如下所示 它包含大约 2500 多个条目,我有 3 天的时间。 因此,为了更好地筛选出适合我的大学,我需要将内容与多个正则表达式进行匹配,例如 应包含“计算机”或“信息”字词 应同时包含 GE 和 FALSE 应该匹配正则表达式[0-9]{5,} 我首先尝试在 中打开它libreoffice calc,但它在 中打开libreoffice Draw。我尝试了pdftohtml和pdftotext,但两者都弄乱了。 最后我找到了pdfgre...
我正在检查一篇论文的参考文献,想找到正文中引用某篇论文(在参考文献列表中)的位置。有没有支持通过 bash 搜索并提取位置上下文的 PDF 编辑器?我尝试将 PDF 转换为文本,但效果不佳。 ...
当我想搜索一个片段时,比如searchPart1 一些未知的文本 searchPart2在文本文件中,我使用 searchPart1.*searchPart2。但这在我使用的任何 pdf 阅读器中都是不可能的。目前,我将 pdf 转换为文本文件并使用less或打开它geany,然后使用其上可用的正则表达式。 除了命令行之外,是否有带有正则表达式搜索的 PDF 阅读器pdfgrep ...
我想搜索一个词,例如fooonetwo在一个 pdf 中。所以关键是我不知道真正的病房是foo_one_two或者foo.一.二或者foo-一二或者foo-一_二!或者 ... 。 或者说我想搜索同时包含富和一和二我记得在数据库中我们有这样的功能:例如,查询以 开头的单词富还包括一和二。那么有没有 PDF 查看器可以做到这一点? 有哪些 PDF 查看器以及如何做到这一点。 ...
原则上这可能吗? 在我看来,gnome-search-tool、Catfish 和 Searchmonkey 等搜索工具可以在文本文件中搜索,但不能在其他更复杂的文档(如 pdf 或 LibreOffice 处理的扩展)中搜索。我是不是漏掉了什么? 有什么程序可以实现这个目标吗? ...
我正在尝试 grep 受密码保护的 PDF(信用卡对账单)中的字符串。有多个具有不同密码的文件。这手册页(?) 说 --password=Value 可以指定多次,并且每个密码都会针对每个要 grep 的 pdf 文件进行尝试。但是,我发现只有最后一个密码被使用。 pdfgrep -P "[0123][0-9] [JFMASOND][aepuco][nbrylgptv] [012][0-9].+[0-9,]+\.[0-9][0-9] *([cC][rR])?" --password=password1 --password=password2 *.pdf ...
我想使用 pdf grep,当我想按阿拉伯文本或字符串搜索时它可以工作。它什么也没显示。但是,当我按英文字符串搜索时,它可以正常工作。有人有解决方案甚至替代方案吗?谢谢,这是我使用的代码顺便说一句 pdfgrep -in 'احمد' name.pdf ...
我正在使用“pdfgrep”在几个 pdf 文件中进行“深度搜索”,试图找到一个单词并计算文档的数量,如下所示: # pdfgrep -ric PATTERN ./Example1.pdf:0 ./Example2.pdf:10 知道如何忽略具有已定义计数的文件的打印输出吗?比如 0 或小于...? ...
我经常发现自己在寻找 PDF 文档。幸运的是,我发现 pdfgrep 在按内容查找 PDF 文档方面确实做得很好。 通过以下命令,我可以搜索首页上包含我的搜索词的文档 pdfgrep -irl --page-range=1 2>/dev/null 'mysearchword' 是否可以将此命令集成到 Nemo 文件管理器搜索中? ...
我正在尝试使用 pdfgrep 搜索特定模式的每次出现(必须以 E 或 S 开头),然后后跟 5 位数字(仅)然后执行命令(可能是 mv 命令) 到目前为止,我有以下命令: pdfgrep -e '[E-S]\d{5,}$' filename.pdf 但无论如何,我都无法在该 PDF 中找到任何内容。搜索特定术语(pdfgrep“term”filename.pdf)确实会返回相关术语,因此我知道 pdfgrep 能够找到它。 我猜我的问题是命令或正则表达式的语法,但我找不到确切的位置...... ...
我总是使用“pdfgrep”从命令行搜索多个 PDF 文件的内部。但我遇到了一个问题:这个连字字符“fi”(参见https://www.compart.com/en/unicode/U+FB01)。 “fi”在“fixed”一词中,因此我无法使用 搜索术语“定点运算符” pdfgrep -iR 'fixed point operator'。但是,当我使用Foxit reader和Evince等PDF阅读器打开该文件时,“fi”被拆分为“f”和“i”,因此可以搜索。 “pdfgrep”有更可靠的替代品吗?或者“pdfgrep”中是否有任何选项关键字来扩展编码?...
我正在使用 zathura,因为我喜欢它的极简主义方法,但如果这能解决我的问题,我也会切换到 mupdf 或其他任何东西。 我需要从头到尾逐个突出显示每个单词(在 PDF 和 epub 文档中),因为如果文本中有某种动作,我可以更好地专注于文本。我的方法是执行匹配每个单词的正则表达式搜索,但 zathura 和 mupdf 都不支持搜索中的正则表达式。有没有办法做到这一点? 我会尝试分叉 zathura,但说实话,如果有另一个最小的 Gnu/Linux 兼容文档查看器可以满足我的需要,我真的不想花那么多时间。如果有任何方法可以使用终端工具(例如 ...
我想在 pdf 文件中搜索所有页面,每个页面包含几个给定的单词,没有特定的顺序。例如,我想查找同时包含“hello”和“world”的所有页面(不按特定顺序排列)。 我不确定是否pdfgrep 可以做到。 我正在尝试做一些类似于我们如何在 Google 图书中显示的书中搜索多个单词的操作。 谢谢。 ...
有没有可以根据关键字分割PDF文件的实用程序?我只能找到按页面分割的内容(例如QPDF)。我还可以看到 pdfgrep,但我不知道这是否已经合并到其他实用程序中。我可以编写 bash 脚本,但如何从 pdfgrep 返回要分割的页面? ...