本质上我正在寻找一个可以让我实现以下工作流程的工具(Windows / Mac):
- 将我的所有文件扫描到一个文件夹中(200-300 张扫描图像)
- 运行该工具,它将检查所有文件并对其运行 OCR
- 基于OCR,元数据被应用到每个文件上。
- 然后我读取元数据并通过批处理对文件进行相应的分类。
尽管 SU 和 SE 中有很多关于对文件进行简单 OCR 的建议,但我无法找到一种解决方案,能够让我根据文档中的 OCR 数据进行类似编程的操作。
文档模板是标准的,因此我们知道需要什么样的文件。我们只想扫描整个文件,然后运行后端进程,将其整齐地分类/上传到相应的文件夹中。使用 OCR 后,我可以选择在文件内进行搜索,同时在 Acrobat reader/Preview 等程序中打开它。但我想从批处理/shell/apple 脚本运行此分类逻辑。例如将文档编号添加到文件名的前缀等。
答案1
您所描述的似乎是一种独特的使用场景。我不相信有解决方案可以像您描述的那样开箱即用。如果这是一个非商业/研究项目,您没有太多选择,尤其是对于 Windows。只需在 Google 上搜索 tesseract 看看您能做什么。
如果你有预算,你可以有多种选择。目前还不清楚你需要现成的解决方案还是 SDK,我假设你需要第一个,所以你为什么不看看识别服务器,它是一款基于服务器的 OCR 解决方案,专为大型部门和企业的中高容量文档处理而设计。它既可以作为独立程序部署,也可以与 DMS、RMS 和电子归档系统等第三方系统集成。
我在 ABBYY 工作,如果需要的话可以为您提供更多信息。希望对您有所帮助!