从摄影中捕捉页面上带有白色背景的文本

从摄影中捕捉页面上带有白色背景的文本

我打算将一张照片(页面上有 txt 文件且背景为白色)转换为 txt 文件。目的是捕获此图像上的所有文本。

我在 Google 上找到了 imagemagick 和以下工具:扫描图像至文本

但这是最好的选择吗?摄影可以捕捉文字吗?谢谢

答案1

另一个好的免费解决方案(网络服务)是https://ocr.space/- 它适用于背景文本,例如电影字幕。

Google 提供了最好的 OCR,但这需要编程才能使用:https://cloud.google.com/vision/

答案2

会购买产品吗?我使用 Omnipage 和/或 Pro 版本已有很长时间了,对其效果非常满意。

http://www.nuance.com/for-individuals/by-product/omnipage/index.htm

数码相机的像素越高越好。如果是胶卷照片,则以 600dpi 扫描。

答案3

您引用的链接中的顶部答案与此类似。我建议您使用现有的黑盒解决方案,而不是尝试自己动手。除非那是您的项目。

一个解决方案是 TesseractOCR多平台开源 OCR

另一个与 MSOffice 相关的是使用 Microsoft® Office 进行 OCR

和另一个GOCR——开源字符识别

相关内容