使用 OCR 进行表格识别并返回值的图像

使用 OCR 进行表格识别并返回值的图像

我正在进行一个处理数百份表格的项目。这些表格的格式一致,但由不同的人手工填写。我需要一种方法来快速将所有这些数据处理成电子表格。

对于打字文档的 OCR 识别似乎很成熟,但对于手写文件的识别却非常缺乏。

为了这个想法,让我们考虑一个具有多个字段的表单,其结构如下:

字段1值1

例如:

Name: John

其中Name是字段,John是值。

考虑到表单的结构和类型,OCR 应该能够识别/解释这些字段。但是,这些字段的值是手写的,OCR 的表现会很差。

那么,有没有一种方法可以识别图像上的字段,然后返回值的图像块?

答案1

您可以尝试使用 FineReader Engine。它不仅可以识别打字文档(OCR 技术),还可以识别手写内容(ICR 技术)。
因此,您可以识别这两个字段并将数据导出到电子表格中。

为 ABBYY 工作,如果您需要有关我们产品的任何附加信息,我将很乐意为您提供帮助。

相关内容