我打算将一张照片(页面上有 txt 文件且背景为白色)转换为 txt 文件。目的是捕获此图像上的所有文本。
我在 Google 上找到了 imagemagick 和以下工具:扫描图像至文本
但这是最好的选择吗?摄影可以捕捉文字吗?谢谢
答案1
另一个好的免费解决方案(网络服务)是https://ocr.space/- 它适用于背景文本,例如电影字幕。
Google 提供了最好的 OCR,但这需要编程才能使用:https://cloud.google.com/vision/
答案2
会购买产品吗?我使用 Omnipage 和/或 Pro 版本已有很长时间了,对其效果非常满意。
http://www.nuance.com/for-individuals/by-product/omnipage/index.htm
数码相机的像素越高越好。如果是胶卷照片,则以 600dpi 扫描。
答案3
您引用的链接中的顶部答案与此类似。我建议您使用现有的黑盒解决方案,而不是尝试自己动手。除非那是您的项目。
一个解决方案是 TesseractOCR多平台开源 OCR
另一个与 MSOffice 相关的是使用 Microsoft® Office 进行 OCR
和另一个GOCR——开源字符识别