我恰好收藏了大量的电子书,包括 PDF 和 DjVus(带文本层)。我希望能够“搜索”电子书内容中的短语。在谷歌上搜索这个问题一段时间后,我发现没有软件(已停用的 Google 桌面搜索除外)能够读取 .djvu 文件中的文本层。
我的需求相当简单:我不需要索引电子邮件、JPG 中的元数据等。只需要 PDF 和 DjVus 以及纯文本文件。我需要很好地控制要索引的内容(只需要一个目录,仅此而已)。
我正在使用 Windows。
这里有人知道这个问题的解决方案吗?
我目前研究过的项目有:
- 比格犬
- 哥白尼桌面搜索
- 梗类犬
- Google 桌面(已停用)
也许最好的建议是坚持使用 Google 桌面搜索?如果是这样,是否可以将其配置为仅索引特定目录?
答案1
考虑 Archivarius 3000http://www.likasoft.com/
答案2
如果您使用 Windows 7,则可以安装适用于 PDF 和 DJVU 的第三方 IFilter,并使用内置搜索,如中所述如何在 Windows 7 上搜索文件内部?我使用了以下 IFilter:
- PDF 的 IFilter苏门答腊PDF读者,请使用此构建适用于 64 位版本。安装 SumatraPDF 时,请确保在“选项”菜单中勾选相应的复选标记。
- 来自的 IFilterDjVu Shell 扩展包,它提供了更多有用的功能来与 DJVU 配合使用。