我想用最少的麻烦扫描大量闲置的纸张。我想使用简单扫描将它们转换为图像,然后使用 OCR 将它们转换为文本。有没有一款带有 GUI 的优秀 OCR 应用程序,只需按一下按钮即可获得良好的结果?
答案1
克拉拉是另一个不错的图形选项。
科卡 从 是一个 KDE 应用程序,但运行良好,此外您还必须安装实际的 OCR 程序,如 GOCR 和 OCRAD。安装 Kooka 和 OCR 程序后,您必须将 Kooka 指向 OCR 安装位置,以便它能够将 JPEG 转换为文本。
立方体 从 是命令行实用程序,使用非常简单。您可以安装语言包tesseract-ocr-eng从 这里。
看看这个页。
笔记:
跑步立方体转到终端并输入以下内容
tesseract imagefile.tif outputfile.txt
Tesseract 只能读取 TIFF 文件 - 如果您有 JPEG 或 PDF 或其他格式,则必须对其进行转换。此外,文件扩展名必须是 .tif,而不是 .tiff,否则 tesseract 会出错。
答案2
扫描PDF
多页 PDF 或扫描文档上的 OCR
这可能是最简单的方法。Gscan2pdf 是一个图形工具,它不仅允许您扫描文件,还可以导入文件并对其执行 OCR。安装gscan2pdf 来自这里 ,从 Ubuntu 软件中心或在终端中运行此命令:
sudo apt-get install gscan2pdf
- 运行 gscan2pdf
- 导入 pdf(Ctrl+O)
- 可选:工具 > 清理
- 选择“工具”>“OCR 保存”(Ctrl+S)
Gscan2PDF 可以使用可定制的 OCR 引擎,默认为tesseract-ocr
您可能考虑选择适当的语言。在这种情况下,您需要安装tesseract-ocr-LANG
软件包,其中LANG
有三个字母的 ISO 639-2 语言代码。目前,您在 16.04 repo 上有 108 种语言。
答案3
您可以使用一些流行的 OCR 命令行工具(我不确定它们是否有 GUI):
-
还适用于:Tesseract .NET,Tesseract iOS
1985 年至 1995 年期间 HP 实验室开发的 OCR 引擎... 现在由 Google 使用。Tesseract 可能是目前最准确的开源 OCR 引擎。
用法:
tesseract [inputFile] [outputFile] [-l optionalLanguageFile] [PathTohOCRConfigFile]
-
开源字符识别。它将文本的扫描图像转换回文本文件。GOCR 可以与不同的前端一起使用,这使得它很容易移植到不同的操作系统和架构。它可以打开许多不同的图像格式,而且它的质量每天都在提高。
奥卡普斯™(常问问题)(以 Python、NumPy 和 SciPy 编写)
OCR 系统专注于使用大规模机器学习解决文档分析问题,具有可插入布局分析、可插入字符识别、统计自然语言建模和多语言功能。
OCRopus 引擎基于两个研究项目:20 世纪 90 年代中期开发并由美国人口普查局部署的高性能手写识别器,以及新颖的高性能布局分析方法。
OCRopus 的开发由 Google 赞助,最初旨在实现高吞吐量、大容量的文档转换。我们期望它也能成为许多其他应用程序的优秀 OCR 系统。
Tessnet2(开源、OCR、Tesseract、.NET、DOTNET、C#、VB.NET、C++/CLI)
Tesseract 是一个 C++ 开源 OCR 引擎。Tessnet2 是 .NET 程序集,它公开了执行 OCR 的非常简单的方法。Tessnet2 遵循 Apache 2 许可证(与 tesseract 一样),这意味着您可以随意使用它,包括在商业产品中。
其他一些:适用于 Linux 的 ABBYY CLI OCR,Asprise OCR
欲了解更完整列表,请查看:光学字符识别软件列表在维基百科
也可以看看:wanghaisheng/awesome-ocr
- 精选有前景的 OCR 资源列表在 GitHub 上。
答案4
Linux 智能 OCR 解决方案
免责声明 - 我与此开源解决方案的开发密切相关
Lios 可以使用扫描仪或相机将印刷品转换为文本。
它还可以从来自其他来源(如 PDF、图像或包含图像的文件夹)的扫描图像生成文本。
该计划为视障人士提供了完全的可访问性。
由于我与他人联系密切,所以我很乐意收到反馈。