扫描PDF

扫描PDF

我想用最少的麻烦扫描大量闲置的纸张。我想使用简单扫描将它们转换为图像,然后使用 OCR 将它们转换为文本。有没有一款带有 GUI 的优秀 OCR 应用程序,只需按一下按钮即可获得良好的结果?

答案1

  • 哥斯达黎加 是一个 OCR(光学字符识别)程序。它将文本的扫描图像转换回文本文件。

  • 克拉拉是另一个不错的图形选项。

  • 奥克拉荷马大学 是一个可以用作独立控制台应用程序或作为其他程序的后端的 OCR。

  • 科卡 是一个 KDE 应用程序,但运行良好,此外您还必须安装实际的 OCR 程序,如 GOCR 和 OCRAD。安装 Kooka 和 OCR 程序后,您必须将 Kooka 指向 OCR 安装位置,以便它能够将 JPEG 转换为文本。

  • OCR送料机 是一个文档布局分析和光学字符识别系统。

  • 立方体 是命令行实用程序,使用非常简单。您可以安装语言包tesseract-ocr-eng这里

看看这个

笔记:
跑步立方体转到终端并输入以下内容

tesseract imagefile.tif outputfile.txt

Tesseract 只能读取 TIFF 文件 - 如果您有 JPEG 或 PDF 或其他格式,则必须对其进行转换。此外,文件扩展名必须是 .tif,而不是 .tiff,否则 tesseract 会出错。

答案2

扫描PDF

多页 PDF 或扫描文档上的 OCR

这可能是最简单的方法。Gscan2pdf 是一个图形工具,它不仅允许您扫描文件,还可以导入文件并对其执行 OCR。安装gscan2pdf 来自这里 安装 gscan2pdf,从 Ubuntu 软件中心或在终端中运行此命令:

sudo apt-get install gscan2pdf
  • 运行 gscan2pdf
  • 导入 pdf(Ctrl+O)
  • 可选:工具 > 清理
  • 选择“工具”>“OCR 保存”(Ctrl+S)

Gscan2PDF 可以使用可定制的 OCR 引擎,默认为tesseract-ocr

您可能考虑选择适当的语言。在这种情况下,您需要安装tesseract-ocr-LANG软件包,其中LANG有三个字母的 ISO 639-2 语言代码。目前,您在 16.04 repo 上有 108 种语言。

答案3

您可以使用一些流行的 OCR 命令行工具(我不确定它们是否有 GUI):

  • 立方体自述常问问题) (Python)

    还适用于:Tesseract .NETTesseract iOS

    1985 年至 1995 年期间 HP 实验室开发的 OCR 引擎... 现在由 Google 使用。Tesseract 可能是目前最准确的开源 OCR 引擎。

    用法:

    tesseract [inputFile] [outputFile] [-l optionalLanguageFile] [PathTohOCRConfigFile]
    
  • 哥斯达黎加

    开源字符识别。它将文本的扫描图像转换回文本文件。GOCR 可以与不同的前端一起使用,这使得它很容易移植到不同的操作系统和架构。它可以打开许多不同的图像格式,而且它的质量每天都在提高。

  • 奥卡普斯™(常问问题)(以 Python、NumPy 和 SciPy 编写)

    OCR 系统专注于使用大规模机器学习解决文档分析问题,具有可插入布局分析、可插入字符识别、统计自然语言建模和多语言功能。

    OCRopus 引擎基于两个研究项目:20 世纪 90 年代中期开发并由美国人口普查局部署的高性能手写识别器,以及新颖的高性能布局分析方法。

    OCRopus 的开发由 Google 赞助,最初旨在实现高吞吐量、大容量的文档转换。我们期望它也能成为许多其他应用程序的优秀 OCR 系统。

  • Tessnet2(开源、OCR、Tesseract、.NET、DOTNET、C#、VB.NET、C++/CLI)

    Tesseract 是一个 C++ 开源 OCR 引擎。Tessnet2 是 .NET 程序集,它公开了执行 OCR 的非常简单的方法。Tessnet2 遵循 Apache 2 许可证(与 tesseract 一样),这意味着您可以随意使用它,包括在商业产品中。

其他一些:适用于 Linux 的 ABBYY CLI OCRAsprise OCR

欲了解更完整列表,请查看:光学字符识别软件列表在维基百科

也可以看看:wanghaisheng/awesome-ocr- 精选有前景的 OCR 资源列表在 GitHub 上。

答案4

Linux 智能 OCR 解决方案

免责声明 - 我与此开源解决方案的开发密切相关

Lios 可以使用扫描仪或相机将印刷品转换为文本。

它还可以从来自其他来源(如 PDF、图像或包含图像的文件夹)的扫描图像生成文本。

该计划为视障人士提供了完全的可访问性。

由于我与他人联系密切,所以我很乐意收到反馈。

相关内容