在多个 PDF 和文档中搜索文本

在多个 PDF 和文档中搜索文本

我得到了其他学生写的一堆笔记,但它们来自一本旧教科书,没有按照相同的顺序处理所有内容,所以我需要搜索每一章的笔记(每个章节都在不同的 .pdf 或 .doc 中)以查找“跟踪调节”等内容。

我曾经为此使用过 Google Desktop,现在我有 Launchy 并告诉它搜索 pdf,但它只搜索标题,而不搜索内容。

谢谢你的帮助。

答案1

雷科尔可能是您在 Linux 上能找到的最通用的文档搜索引擎:

在此处输入图片描述

它支持多种不同的格式,并且可定制性很强。

有关安装说明和其他提示,请查看这个答案官方文档也非常有用。

答案2

安装包pdfgrep

sudo apt-get install pdfgrep

然后使用命令:

find /path -iname '*.pdf' -exec pdfgrep pattern {} +

答案3

使用文档提取器,它是一个可以索引和搜索多种文档类型的本机 Linux 应用程序。

答案4

基因 (或 ripgrep-all)是一个命令行工具,用于在目录中递归搜索正则表达式模式的所有文件,可在 Linux、macOS 和 Windows 上运行。它是面向行的递归搜索程序 ripgrep 的包装器,在此基础上,它支持在多种文件类型中进行搜索,例如 PDF、DOCX、ODT、EPUB、SQLite 数据库、嵌入在 MKV 或 MP4 文件中的电影字幕、ZIP 或 GZ 等档案等等。

相关内容