寻找软件将 doc 的 jpeg 扫描图像的文件名重命名为图像中的文本

寻找软件将 doc 的 jpeg 扫描图像的文件名重命名为图像中的文本

我正在使用自动文档进纸扫描仪将许多 A4 纸质文档扫描为 JPEG 格式。

结果为FILE0001.JPG、FILE0002.JPG等。

我希望有一个程序可以将文件名标题重命名为实际扫描的 jpeg 图像本身中的文本。最好是,为了确定标题,程序会查找图像中最大的文本,并且该文本最靠近图像顶部。

我知道有几个商业和一些免费的 OCR 应用程序,并且愿意在必要时购买,但是这些应用程序似乎具有我需要的更多功能:它们可以转换为 PDF 等,而我只是希望保持简单并处理原始扫描图像。

欢迎适用于 Windows XP、7 或 MacOS 的开箱即用且易于使用的程序。

答案1

您正在寻找的东西非常复杂,而且即使找到也不可能可靠。

我认为您所能期望的最好结果是使用 Microsoft OneNote(Office 的一部分)或 Evernote(有免费版本)。

这两种软件都可以在后台对笔记中的图像进行 OCR 处理,从而让任何发现的文本都可以搜索。不过,我不确定它们是否会从文本中找出笔记标题,但如果你确保笔记中没有其他文本,它们可能会这样做。试试看。

但请注意,即使对于扫描良好的打字或排版文档,OCR 也远非可靠,即使如此,了解标题的构成,虽然对于人类来说很容易解析,但对于计算机来说是一项非常艰巨的任务。

更新:复杂性来自很多方面。将图像 OCR 转换为文本的操作对于机器来说已经足够复杂了。语言的复杂性如此之多,以至于很难从图像中找出含义,即使该图像是排版的。即使是排版字符也会有很大差异,尤其是在扫描时,由于扫描限制、角度变化、源文本弄脏或其他损坏(例如纸张上的折叠)等原因。其次,标题是什么?很明显,你可能会想 - 页面顶部比“平均”大的东西?系统如何计算出平均字体大小?这本身就是一项艰巨的任务,因为它需要“解析”整个扫描。然后布局有很多组合 - 机器应该尝试识别哪些?以一份普通的商业报告为例,它可能有几个类似标题的文本元素。

即使是在现代 PC 上,这些处理中的每一个环节都要花费大量时间,并且涉及大量数据处理:清理图像、拉直图像(识别文本的边缘和“线条”)、挑选字体样式以了解哪些是文本哪些不是文本、尝试识别文本(可能应用拼写和语法规则)、计算字体大小和平均值、识别要忽略的重复元素(页眉/页脚)、尝试在文档的早期识别较大的文本。猜测标题,检查它是否是平台的有效文件名,如果不是,则进行更改,确保名称是唯一且未使用过的。唷!

大多数 OCR 工具最多只能实现标准扫描中干净、直进式文档的 90% 左右的准确率。您想获得 90% 准确率的文档标题吗?对您来说,这可能没问题,但产品的客户会忍受吗?在完成所有开发之后,供应商是否值得冒这个风险?

我不知道这些问题的答案。我知道这可能是一个很棒的功能,但我不知道是否有人提供此功能(我也通过 Google 进行了快速检查)。

如果所有文档的布局都相同,那么会更容易。然后您可以使用“分区”,这是大多数更好的工具提供的功能,并将适当的区域作为文件名的基础。这会更可靠(但不是完全可靠)。也许你应该咨询一些供应商,看看他们是否有兴趣这样做。

答案2

您只需单击图像>重命名>(您的姓名).jpg>输入即可

就完成了!只需记住保留文件扩展名:.jpg

就这样吧。祝一切顺利!

相关内容