我正在尝试使用 Adobe Pro (2015) 的 OCR 功能来获取演示文稿中的所有文本。演示文稿恰好是 PowerPoint 格式的。如果我打印演示文稿并扫描,我可以使用 Adobe 进行 OCR。但是,我想跳过打印/扫描步骤。我尝试将 PowerPoint 转换为 PDF。但是,似乎无论我在创建 PDF 时选择什么选项,OCR 都无法拾取嵌入图像中的文本。
(冒着提出第二个问题的风险:)“识别文本”选项似乎适用于扫描的文档。创建 PDF 时,有没有办法创建它,使其表现得像扫描的一样?或者也许有更直接的途径来解决我的问题?
答案1
将 Powerpoint 导出为 jpeg。现在您有了可以进行 OCR 处理的“扫描件”。