用于读取固定设计文档的OCR库

用于读取固定设计文档的OCR库

是否有任何 OCR 库/cliapp 可以让我做这样的事情:

# ./ocrapp -input file.pdf -posx 3.6cm -posy 7.8cm -width 10cm -height 1.5cm -output rawdata.txt

我正在尝试自动从扫描的发票和账单中读取客户 ID 号、金额等。我正在寻找一个库或一个 CLI 应用程序,因为我想从中创建自己的文档管理系统 ;)(平台并不重要,不仅仅是 osx)。

典型的挪威发票如下所示:http://www.fakturo.no/img/uploads/WindowsLiveWriterHvordansenderderefakturaenppapir_1001Bfakturaeksempel_uten_logo_thumb_1.gif

我需要提取的信息在底部。(KID、Beløp 和 Kontonummer)

有小费吗?

答案1

我建议你找一个命令行裁剪工具例如https://askubuntu.com/questions/124692/command-line-tool-to-crop-pdf-files在 Ubuntu 上

然后,您可以编写一个简短的脚本,将每张发票裁剪成包含所需文本的小部分,然后通过任何 OCR 程序运行这些部分。

当然,如果你正在编写文档管理系统,那么这一切都可以使用你选择的编程语言的通用库来完成(这个问题可能应该在 stackoverflow 上)

答案2

尝试使用 ABBYY Cloud OCR SDK。这是有关如何识别文本字段的详细指南的链接:http://ocrsdk.com/documentation/quick-start/text-fields 我在 ABBYY 工作,如果您需要更多信息,我很乐意为您提供帮助。

相关内容