Acrobat XI Pro 中同时包含文本和图像的页面上的 OCR

Acrobat XI Pro 中同时包含文本和图像的页面上的 OCR

为什么 Acrobat XI Pro 不允许对包含图像和可渲染文本的页面进行 OCR 扫描?屏幕截图中的示例 PDF 是从 MS Word 文档创建的。第一行是输入的;第二行是单独文档的屏幕截图。

这似乎是一个任意的限制。Acrobat 不能跳过可渲染文本并扫描其他所有内容,这有什么好的理由吗?有没有一种简单的方法可以只对页面的一部分运行 OCR?

在此处输入图片描述

答案1

是的,这是一个任意限制,并且它将不再在 Acrobat XI 中修复。

最佳做法是将页面导出为 TIFF,然后将其重新加载到 Acrobat 中。现在,所有内容都是图像,因此可以对页面进行 OCR。

相关内容