我正在进行一个处理数百份表格的项目。这些表格的格式一致,但由不同的人手工填写。我需要一种方法来快速将所有这些数据处理成电子表格。
对于打字文档的 OCR 识别似乎很成熟,但对于手写文件的识别却非常缺乏。
为了这个想法,让我们考虑一个具有多个字段的表单,其结构如下:
字段1:值1
例如:
Name: John
其中Name
是字段,John
是值。
考虑到表单的结构和类型,OCR 应该能够识别/解释这些字段。但是,这些字段的值是手写的,OCR 的表现会很差。
那么,有没有一种方法可以识别图像上的字段,然后返回值的图像块?
答案1
您可以尝试使用 FineReader Engine。它不仅可以识别打字文档(OCR 技术),还可以识别手写内容(ICR 技术)。
因此,您可以识别这两个字段并将数据导出到电子表格中。
为 ABBYY 工作,如果您需要有关我们产品的任何附加信息,我将很乐意为您提供帮助。