我有 5000 个 PDF,其中 500 个 PDF 很重要,其余的都没用。每个 500 个文件中都有一个单词,而其他 4500 个文件中没有这个单词。我进行了多文件搜索,发现我无法从 Adobe Reader 的搜索结果中选择这 500 个 PDF。还有其他方法可以选择包含特定单词的多个 PDF 文件吗?
答案1
您有三个主要选择
选项一:
获取 5000 个 pdf。创建 10 个文件夹,每个文件夹包含 500 个 pdf。运行 10 次单独搜索。
选项二:
Windows 搜索(肯定是 10,不确定其他的,但值得一试)可以搜索 PDF 文件。只需转到您的文件夹,输入您的关键字,就会返回所有相关文件。
选项三:
像 iTextSharp 这样的库允许您使用 C# 之类的语言从文档中获取文本。您可以循环遍历所有文档并对它们执行所需的操作(假设您能够使用 C#)。
显然,FoxIt 阅读器提供了类似的文件夹搜索功能 - 但我不知道这是否也限制为 500。