我正在寻找一个能够抓取我们内联网网站的内部网搜索引擎和网络共享,如 SMB、NFS 和可选的 AFP。
对我们来说更好的是一个可以通过插件扩展的搜索引擎,就像 Mac OS X 上的 Spotlight 框架一样。
有人知道类似的东西吗?到目前为止,我发现的大多数结果只能抓取网站。
答案1
Xapian Omega 非常棒。它可在大多数操作系统上运行。
Xapian 是一款适应性极强的工具包,允许开发人员轻松地为自己的应用程序添加高级索引和搜索功能。它支持概率信息检索模型,还支持一组丰富的布尔查询运算符。
然后将其与 Omega 结合起来,再次引用他们的网站
Omega 操作一组数据库。每个数据库都是使用 omindex 或 scriptindex 单独创建和更新的。您可以通过 CGI 应用程序 omega 提供的 Web 前端搜索这些数据库(或具有合适内容的任何其他 Xapian 数据库)。还可以一次搜索多个数据库。
它易于安装和运行,即使处理大量文件也非常快。我们使用它来索引网站上传目录和约 350GB 的 Samba 共享。
答案2
有谷歌搜索设备..它应该能满足你的要求...尽管它可能会花费你一大笔钱.. http://www.google.co.uk/enterprise/gsa/index.html
答案3
怎么样露天? 在文档管理方面,它几乎无所不能——但要注意,Alfresco 非常耗费资源,有自己的问题,而且安装起来并不容易。或者,安装部分很容易,配置为什么有无数按钮需要点击,这让点击变得更加困难... :-)