命令行友好的全文索引?

命令行友好的全文索引?

是否有全文索引引擎之类的东西,可以从命令行查询,并且理想情况下根本不需要使用图形用户界面?

我对索引我的电子书和论文特别感兴趣,所以这是 pdf、epub 和一些 djvu 的混合体。 (开放)Office 文档会很好,但在我的列表中要低得多。

答案1

你看过 Lucene 或 Sphinx 吗?虽然您需要首先解析要索引的文档,但完成后,任何一个都可以从 cli 进行搜索。

对于 Lucene,有一些关于执行此操作的信息可用的

Sphinx,有点模糊,但也有一些文档可用的。您可以通过 xmlpipe2 数据源将您选择的结构化 XML 数据传递到 sphinx。

Lucene 依赖于 Java,而 Sphinx 是用 C++ 构建的,不需要外部依赖。

任何一个都需要一些工作才能完成您想做的事情,但是,这似乎是一个完全可行的解决方案。

答案2

查看西片。它具有命令行界面,可以索引多种格式。

答案3

雷科尔可以在没有 GUI 的情况下构建,并且可以从命令行搜索您的文档类型。

它用夏皮安在引擎盖下。

答案4

Tracker 可以从命令行调用,并且 gtk+ 不是项目的硬依赖项(但可能是包的硬依赖项)。

相关内容