是否有可用的插件或解决方案Windows 搜索嵌入到 pdf 文件中的图形页面中的索引文本。
令人惊奇的是Omnipage OCR 插件我使用 WinXP 时,哪个适用于 Google 桌面?
答案1
Microsoft® 提供有效的工具来组织不同级别的企业搜索,从集中内容存储到桌面。Microsoft Office SharePoint Server 在 SharePoint 文档库和文件夹中具有强大的搜索功能;Windows Search 有助于在台式计算机上查找文件。
ABBYY 识别服务器 IFilter是这些企业搜索引擎的强大附加组件,使它们能够搜索图像文档的全部内容。通常,企业搜索引擎只能索引 HTML、RTF、DOC、XLS 等文档文件格式的全文。实际上,JPEG、PDF 和 TIFF 等图像文件中包含许多重要信息,因此传统搜索引擎无法找到这些信息。扫描和拍摄的文档、发票、信件、合同,所有这些文档都只能使用文件名检索,而不能使用文档的实际内容。要将全文搜索扩展到图像文档,并发现所有重要信息,OCR IFilter 功能必不可少。
ABBYY Recognition Server 及其 OCR IFilter 组件正是合适的解决方案:它通过 OCR“解锁”图像文档的内容,并使其可供 SharePoint Server 和 Microsoft Search 索引。借助 ABBYY Recognition Server IFilter,文档搜索真正变得无所不包。
您可能还会对以下文章感兴趣:使用 PowerShell 和 Solid PDF 工具对 SharePoint 文档库中的所有 PDF 文件进行 OCR(我知道它提到了 SharePoint,但没有理由不能在本地机器上运行 PowerShell 代码)。