寻求有关工具/流程的建议,以便在约 2TB 的数据中搜索特定短语。这将包括办公文档、.txt 和 PDF。
我看到有很多用于此目的的工具,但没有多少可以处理 PDF。
谢谢。
答案1
尝试这个:http://www.microsoft.com/enterprisesearch/en/us/search-server-express.aspx
“Search Server 2010 Express 和 SharePoint Server 2010 中提供了以下现成的连接器:
- SharePoint 网站
- Windows 文件共享
- Exchange 公用文件夹
- 莲花便笺
- 网站
- 用于附加存储库的 IFilter
- 数据库中的结构化内容
- 联合对象模型
“-http://www.microsoft.com/enterprisesearch/searchserverexpress/en/us/compare.aspx
也读一下讨论了一些局限性。