Acrobat XI Pro 中同时包含文本和图像的页面上的 OCR

2024-6-17 • tag-icon

为什么 Acrobat XI Pro 不允许对包含图像和可渲染文本的页面进行 OCR 扫描？屏幕截图中的示例 PDF 是从 MS Word 文档创建的。第一行是输入的；第二行是单独文档的屏幕截图。

这似乎是一个任意的限制。Acrobat 不能跳过可渲染文本并扫描其他所有内容，这有什么好的理由吗？有没有一种简单的方法可以只对页面的一部分运行 OCR？

是的，这是一个任意限制，并且它将不再在 Acrobat XI 中修复。

最佳做法是将页面导出为 TIFF，然后将其重新加载到 Acrobat 中。现在，所有内容都是图像，因此可以对页面进行 OCR。

相关内容