扫描 A4 文档 > pdf > ocr > 翻译成英文?

扫描 A4 文档 > pdf > ocr > 翻译成英文?

我尝试过使用

  • 我的家用扫描仪可以创建“300 dpi”、“文档”、“pdf”(佳能一体机上的选项)
  • ZoHoViewer 创建 RTF 或 TXT 文件
  • 谷歌文档翻译

我不确定 ZoHoViewer 是一款多好或多坏的产品,但以下是:

作为劳动合同的受益人,我们享有法定的救济金和

变成:

作为劳动市场调节价的组成部分,圣...

因此,goog docs 在尝试翻译它时犯了大错。

有没有人有更好的建议(最好是免费的在线服务)

答案1

SuperUser 上还有其他几个关于 OCR 的问题,可能值得查看以寻找可能的解决方案。

最为显着地Molly 的这个回答看起来很有希望:

我很喜欢顶级OCR,无疑是您扫描工具的一个很好的补充:

  • 令人难以置信的 OCR 准确率,使用 3 MP 摄像头可高达 99.8%
  • 没有页数限制,无需额外下载或组件
  • 处理混合文本和图形的图像(手动或自动分区)
  • 容忍倾斜和不均匀的照明
  • 多种文本输出格式,包括可搜索的 PDF 和 HTML
  • 能读懂11种不同的语言
  • 功能强大、易于使用的图像处理功能,具有图像去扭曲功能
  • 支持智能手机:查看一些智能手机样本
  • 包括内置的、功能齐全的文本和图像所见即所得编辑器
  • 适用于所有 11 种语言的后处理拼写检查器
  • 内置文本转语音软件。OCR 转 MP3 怎么样?
  • 包含内置多语言文本翻译器
  • 支持命令行界面和 GUI
  • 制作高性能文档搜索和索引系统
  • 浏览器助手模式支持创建免费音频电子书
  • 使用 TopOCR 的 Web 引擎可以轻松添加新功能

替代文本

它非常准确,并且对低质量图像(例如页面/文档的照片)的处理效果非常好

TopOCR 是免费软件(可以使用通用提取器

进一步阅读:

哪款 OCR 软件拥有最多的选项?

将大型书籍转换为数字格式的实用 OCR 解决方案?

如何在 Linux 上使用 OCR 从 PDF 中提取文本?

答案2

假设OCR已经转换:

作为劳工标志...

到:

作为建筑市场参与者...

我想到了一些事情。

  1. 尝试以更高的 dpi 进行扫描。它似乎无法识别单词之间的空格,更高的 dpi可能改善这一点。

  2. 你能设置 OCR 程序的语言吗?我看到它把“ö”转换成了“6”。虽然这可能是分辨率导致的问题,但也可能是因为“ö”不是英语的日常组成部分,所以程序选择了“次优”匹配 - 在本例中是“6”。

答案3

虽然不是 100% 完美,但是是我尝试过的所有东西中最好的:

http://www.paperfile.net/结合语言包(可在应用程序中免费下载说明)将整个文本复制并粘贴到谷歌文档中,然后使用工具>在谷歌文档中翻译

相关内容