如何搜索仅包含图像的文本的 PDF?

如何搜索仅包含图像的文本的 PDF?

PDF 需要搜索文本,但它只是一张图片,所以它无法识别字符。我一直想对 PDF 进行 OCR,但我不熟悉所需的程序。我试过 Foxit Reader,但最新版本的 OCR 选项找不到?是的,我用谷歌搜索过,但所有的说明都是针对完全不同的用户界面。 示例屏幕截图

我也尝试过 Omnipage 18,但它就是挂了,我也找不到明确的说明。PDF 有 800 多页,所以相当大。并非全部都是文本,所以我想保留不应转换为文本的内容,例如表格和图片。我不在乎输出格式是什么,可能是 PDF。

简而言之:我应该在哪里单击 FoxIt Reader 来执行 OCR?

答案1

Microsoft OneNote(包含在许多 MS Office 套件中)具有 OCR 功能。在 OneNote 中打开图像文件(不是 PDF),右键单击图像并选择“从图片复制文本”。现在文本就在剪贴板上,您可以将其粘贴到其他地方。

将图像放入 OneNote 的另一种方法是截取图像的屏幕剪辑并将其发送到 OneNote:打开包含图像的 PDF,进入开始菜单 -> MS Office -> “发送到 OneNote”,选择“屏幕剪辑”,您将在屏幕上看到一个灰色覆盖层。

选择您想要查找文本的图像部分。一旦图像进入 OneNote,文本就会被自动识别,您也可以只需按 ctrl + F 并在 OneNote 中搜索文本,如下面的屏幕截图所示。

在此处输入图片描述

答案2

您可以使用免费空间OCR在线ocr工具。它可以将任何 PDF 转换为可搜索的 PDF

  • 上传您的 PDF 并选择 OCR 语言

  • 几秒钟后,您就可以下载新版本的 PDF,现在可以进行搜索。它是同一份文档,但添加了文本层。

您可以选择让文本层不可见或作为可见的覆盖层。可见选项非常有用,可以快速确认 OCR 质量是否良好。

答案3

您可以使用 Nitro Pro:它允许您识别图像中的文本,此外,它还允许您保存新文件,并使其具有其他 PDF 阅读器的搜索功能。为此,您必须安装 Nitro Pro 并将其设置为默认 PDF 查看器,然后打开任何包含图像中文本的文档:将显示一个弹出窗口,告诉您打开的文档包含图像中的文本,如果您想进行转换,一旦您接受并且过程完成,您就可以开始搜索要查找的文本。

相关内容