为我的 Debian 文件服务器添加基于 Web 的文档搜索

为我的 Debian 文件服务器添加基于 Web 的文档搜索

我有一个基于 Samba 的文件服务器,上面有大量的数据,主要是 Word、Excel、OpenOffice 和 PDF 文档。

我设置了一个简单的基于 Web 的搜索界面(Apache、PHP、mlocate),它只使用文件路径 + mtime。它确实可以工作,但如果所有文档都由 Apache Solr 编入索引就更好了,因为据大家所说,它的速度非常快,可以处理所有这些不同的文档类型。

但它是一个文件服务器,而不是一个网站,所以我需要一些东西来抓取所有文件,并继续抓取和重新索引更新的文件;人们不是在“发布”文档,他们只是按“保存”。

有没有一个项目可以实现这个功能?

答案1

查看inotify。它会立即通知您有关文件系统事件。

答案2

我不确定这是否是提问者想要的,但其他人正在寻找 mlocate 的 Web 界面,请看一下这个:

https://github.com/kaazoo/weblocate

相关内容