扫描PDF

Question 1

哥斯达黎加 从是一个 OCR（光学字符识别）程序。它将文本的扫描图像转换回文本文件。
克拉拉是另一个不错的图形选项。
奥克拉荷马大学 从是一个可以用作独立控制台应用程序或作为其他程序的后端的 OCR。
科卡从是一个 KDE 应用程序，但运行良好，此外您还必须安装实际的 OCR 程序，如 GOCR 和 OCRAD。安装 Kooka 和 OCR 程序后，您必须将 Kooka 指向 OCR 安装位置，以便它能够将 JPEG 转换为文本。
OCR送料机 从是一个文档布局分析和光学字符识别系统。
立方体 从是命令行实用程序，使用非常简单。您可以安装语言包tesseract-ocr-eng从这里。

看看这个页。

笔记：
跑步立方体转到终端并输入以下内容

tesseract imagefile.tif outputfile.txt

Tesseract 只能读取 TIFF 文件 - 如果您有 JPEG 或 PDF 或其他格式，则必须对其进行转换。此外，文件扩展名必须是 .tif，而不是 .tiff，否则 tesseract 会出错。

Answer

哥斯达黎加 从是一个 OCR（光学字符识别）程序。它将文本的扫描图像转换回文本文件。
克拉拉是另一个不错的图形选项。
奥克拉荷马大学 从是一个可以用作独立控制台应用程序或作为其他程序的后端的 OCR。
科卡从是一个 KDE 应用程序，但运行良好，此外您还必须安装实际的 OCR 程序，如 GOCR 和 OCRAD。安装 Kooka 和 OCR 程序后，您必须将 Kooka 指向 OCR 安装位置，以便它能够将 JPEG 转换为文本。
OCR送料机 从是一个文档布局分析和光学字符识别系统。
立方体 从是命令行实用程序，使用非常简单。您可以安装语言包tesseract-ocr-eng从这里。

看看这个页。

笔记：
跑步立方体转到终端并输入以下内容

tesseract imagefile.tif outputfile.txt

Tesseract 只能读取 TIFF 文件 - 如果您有 JPEG 或 PDF 或其他格式，则必须对其进行转换。此外，文件扩展名必须是 .tif，而不是 .tiff，否则 tesseract 会出错。

Question 2

扫描PDF

多页 PDF 或扫描文档上的 OCR

这可能是最简单的方法。Gscan2pdf 是一个图形工具，它不仅允许您扫描文件，还可以导入文件并对其执行 OCR。安装gscan2pdf 来自这里，从 Ubuntu 软件中心或在终端中运行此命令：

sudo apt-get install gscan2pdf

运行 gscan2pdf
导入 pdf（Ctrl+O）
可选：工具 > 清理
选择“工具”>“OCR 保存”（Ctrl+S）

Gscan2PDF 可以使用可定制的 OCR 引擎，默认为tesseract-ocr

您可能考虑选择适当的语言。在这种情况下，您需要安装tesseract-ocr-LANG软件包，其中LANG有三个字母的 ISO 639-2 语言代码。目前，您在 16.04 repo 上有 108 种语言。

来源

Answer

扫描PDF

多页 PDF 或扫描文档上的 OCR

这可能是最简单的方法。Gscan2pdf 是一个图形工具，它不仅允许您扫描文件，还可以导入文件并对其执行 OCR。安装gscan2pdf 来自这里，从 Ubuntu 软件中心或在终端中运行此命令：

sudo apt-get install gscan2pdf

运行 gscan2pdf
导入 pdf（Ctrl+O）
可选：工具 > 清理
选择“工具”>“OCR 保存”（Ctrl+S）

Gscan2PDF 可以使用可定制的 OCR 引擎，默认为tesseract-ocr

您可能考虑选择适当的语言。在这种情况下，您需要安装tesseract-ocr-LANG软件包，其中LANG有三个字母的 ISO 639-2 语言代码。目前，您在 16.04 repo 上有 108 种语言。

来源

Question 3

您可以使用一些流行的 OCR 命令行工具（我不确定它们是否有 GUI）：

立方体（自述，常问问题）（Python）

还适用于：Tesseract .NET，Tesseract iOS

1985 年至 1995 年期间 HP 实验室开发的 OCR 引擎... 现在由 Google 使用。Tesseract 可能是目前最准确的开源 OCR 引擎。

用法：
```
tesseract [inputFile] [outputFile] [-l optionalLanguageFile] [PathTohOCRConfigFile]
```
哥斯达黎加

开源字符识别。它将文本的扫描图像转换回文本文件。GOCR 可以与不同的前端一起使用，这使得它很容易移植到不同的操作系统和架构。它可以打开许多不同的图像格式，而且它的质量每天都在提高。
奥卡普斯™（常问问题）（以 Python、NumPy 和 SciPy 编写）

OCR 系统专注于使用大规模机器学习解决文档分析问题，具有可插入布局分析、可插入字符识别、统计自然语言建模和多语言功能。

OCRopus 引擎基于两个研究项目：20 世纪 90 年代中期开发并由美国人口普查局部署的高性能手写识别器，以及新颖的高性能布局分析方法。

OCRopus 的开发由 Google 赞助，最初旨在实现高吞吐量、大容量的文档转换。我们期望它也能成为许多其他应用程序的优秀 OCR 系统。
Tessnet2（开源、OCR、Tesseract、.NET、DOTNET、C#、VB.NET、C++/CLI）

Tesseract 是一个 C++ 开源 OCR 引擎。Tessnet2 是 .NET 程序集，它公开了执行 OCR 的非常简单的方法。Tessnet2 遵循 Apache 2 许可证（与 tesseract 一样），这意味着您可以随意使用它，包括在商业产品中。

其他一些：适用于 Linux 的 ABBYY CLI OCR，Asprise OCR

欲了解更完整列表，请查看：光学字符识别软件列表在维基百科

也可以看看：wanghaisheng/awesome-ocr- 精选有前景的 OCR 资源列表在 GitHub 上。

Answer

您可以使用一些流行的 OCR 命令行工具（我不确定它们是否有 GUI）：

立方体（自述，常问问题）（Python）

还适用于：Tesseract .NET，Tesseract iOS

1985 年至 1995 年期间 HP 实验室开发的 OCR 引擎... 现在由 Google 使用。Tesseract 可能是目前最准确的开源 OCR 引擎。

用法：
```
tesseract [inputFile] [outputFile] [-l optionalLanguageFile] [PathTohOCRConfigFile]
```
哥斯达黎加

开源字符识别。它将文本的扫描图像转换回文本文件。GOCR 可以与不同的前端一起使用，这使得它很容易移植到不同的操作系统和架构。它可以打开许多不同的图像格式，而且它的质量每天都在提高。
奥卡普斯™（常问问题）（以 Python、NumPy 和 SciPy 编写）

OCR 系统专注于使用大规模机器学习解决文档分析问题，具有可插入布局分析、可插入字符识别、统计自然语言建模和多语言功能。

OCRopus 引擎基于两个研究项目：20 世纪 90 年代中期开发并由美国人口普查局部署的高性能手写识别器，以及新颖的高性能布局分析方法。

OCRopus 的开发由 Google 赞助，最初旨在实现高吞吐量、大容量的文档转换。我们期望它也能成为许多其他应用程序的优秀 OCR 系统。
Tessnet2（开源、OCR、Tesseract、.NET、DOTNET、C#、VB.NET、C++/CLI）

Tesseract 是一个 C++ 开源 OCR 引擎。Tessnet2 是 .NET 程序集，它公开了执行 OCR 的非常简单的方法。Tessnet2 遵循 Apache 2 许可证（与 tesseract 一样），这意味着您可以随意使用它，包括在商业产品中。

其他一些：适用于 Linux 的 ABBYY CLI OCR，Asprise OCR

欲了解更完整列表，请查看：光学字符识别软件列表在维基百科

也可以看看：wanghaisheng/awesome-ocr- 精选有前景的 OCR 资源列表在 GitHub 上。

Question 4

Linux 智能 OCR 解决方案

免责声明 - 我与此开源解决方案的开发密切相关

Lios 可以使用扫描仪或相机将印刷品转换为文本。

它还可以从来自其他来源（如 PDF、图像或包含图像的文件夹）的扫描图像生成文本。

该计划为视障人士提供了完全的可访问性。

由于我与他人联系密切，所以我很乐意收到反馈。

Answer

Linux 智能 OCR 解决方案

免责声明 - 我与此开源解决方案的开发密切相关

Lios 可以使用扫描仪或相机将印刷品转换为文本。

它还可以从来自其他来源（如 PDF、图像或包含图像的文件夹）的扫描图像生成文本。

该计划为视障人士提供了完全的可访问性。

由于我与他人联系密切，所以我很乐意收到反馈。

扫描PDF

答案1

答案2

扫描PDF

答案3

答案4

相关内容