如何选择包含特定单词的所有 pdf?

如何选择包含特定单词的所有 pdf?

我有 5000 个 PDF,其中 500 个 PDF 很重要,其余的都没用。每个 500 个文件中都有一个单词,而其他 4500 个文件中没有这个单词。我进行了多文件搜索,发现我无法从 Adob​​e Reader 的搜索结果中选择这 500 个 PDF。还有其他方法可以选择包含特定单词的多个 PDF 文件吗?

答案1

您有三个主要选择

选项一:

获取 5000 个 pdf。创建 10 个文件夹,每个文件夹包含 500 个 pdf。运行 10 次单独搜索。

选项二:

Windows 搜索(肯定是 10,不确定其他的,但值得一试)可以搜索 PDF 文件。只需转到您的文件夹,输入您的关键字,就会返回所有相关文件。

选项三:

像 iTextSharp 这样的库允许您使用 C# 之类的语言从文档中获取文本。您可以循环遍历所有文档并对它们执行所需的操作(假设您能够使用 C#)。

显然,FoxIt 阅读器提供了类似的文件夹搜索功能 - 但我不知道这是否也限制为 500。

答案2

我一直在解决同样的问题,即如何搜索数千个 PDF 文件并处理包含特定字符串的文件。总指挥官PDF搜索插件对我很有用。该插件增强了 Total Commander 的搜索功能,允许搜索 PDF 元标签,甚至进行全文搜索。

Total Commander 也可以作为共享软件使用,但是如果您喜欢它,请为这款出色的管理器的作者做出贡献。

相关内容