具有灰色嘈杂背景的数字的 OCR

Question 1

首先你必须调整这些图片。我推荐使用批处理工具，例如视窗多媒体它是免费的并且支持多平台。

它有一个文件资源管理器。选择所有图片，然后转到工具-批量转换. 像我一样添加操作：

XNViewMP - 批量转换 - 操作选项卡

以下是我的操作：

HLSS- 使其变为灰度：
- 色相：0
- 亮度：0
- 饱和度：-127
级别- 稍微降低黑色水平，这样灰色噪音就会消失
- 黑点：0
- 白点：212 - 可能因图像而异
减少噪音筛选
调整增加对比度
- 亮度：0
- 对比度：127- 这很重要
- 伽马：1.06
最低限度使黑色更浓
- 过滤器尺寸：5x5 - 可能因图像而异

不要忘记另存为tiff（参见输出选项卡）。之后我运行tesseract：

tesseract test.tif text -psm 7

注意我选择了 PSM 模式 7：将图像视为一行文本。如果有多行文本，您可能需要使用模式 6 或 3。

text.txt输出文件的内容如下：

570 394 666 638 043

Answer