我需要扫描数百页,每页的右下角都写有数字。扫描后 - 我需要一款 OCR 软件来识别每页右下角写的数字,并在最后将它们相加。
到目前为止,我可以扫描页面并使用 Adobe Acrobat 中的 OCR,我可以识别页面中手写的数字。是否有机制或任何其他 OCR 软件可以将值传递给 MS Excel 等程序。
我尝试了各种 OCR 程序,如 Neurograph(开源)和其他 OCR 软件的试用版,但无法将它们直接链接到扫描文件。它们可以将 OCR 值导出到 Excel,但不能直接连接到打印机。
这些软件也是批量运行的。是否可以使更新成为一个连续的过程?
有什么建议吗?
系统设置:
预期系统将是连接到扫描仪的 Raspberry PI。扫描仪的输入将提供给 PI,然后 PI 将计算总和并用总数更新数据库。
答案1
如果您要使用 raspberry pi 定制硬件,那么您也可以定制软件。最流行和使用最广泛的 OCR 软件包正在Tesseract OCR
上运行OpenCV
,它们是开源和跨平台的。它们一起可以让您应用过滤器、执行 OCR 以及您可能想要的其他好东西。
我建议你找一些视频,它们会让你觉得设置起来出奇的简单。