是否有任何 OCR 库/cliapp 可以让我做这样的事情:
# ./ocrapp -input file.pdf -posx 3.6cm -posy 7.8cm -width 10cm -height 1.5cm -output rawdata.txt
我正在尝试自动从扫描的发票和账单中读取客户 ID 号、金额等。我正在寻找一个库或一个 CLI 应用程序,因为我想从中创建自己的文档管理系统 ;)(平台并不重要,不仅仅是 osx)。
我需要提取的信息在底部。(KID、Beløp 和 Kontonummer)
有小费吗?
答案1
我建议你找一个命令行裁剪工具例如https://askubuntu.com/questions/124692/command-line-tool-to-crop-pdf-files在 Ubuntu 上
然后,您可以编写一个简短的脚本,将每张发票裁剪成包含所需文本的小部分,然后通过任何 OCR 程序运行这些部分。
当然,如果你正在编写文档管理系统,那么这一切都可以使用你选择的编程语言的通用库来完成(这个问题可能应该在 stackoverflow 上)
答案2
尝试使用 ABBYY Cloud OCR SDK。这是有关如何识别文本字段的详细指南的链接:http://ocrsdk.com/documentation/quick-start/text-fields 我在 ABBYY 工作,如果您需要更多信息,我很乐意为您提供帮助。