使用 OCR 对阿拉伯语文本进行处理

使用 OCR 对阿拉伯语文本进行处理

一位朋友要求我将阿拉伯语文本 .pdf 转换为 Word。Google Docs 似乎不是一个选择,但新的OCR看起来很有希望,因为“识别语言”下拉菜单中提供了阿拉伯语。除了“错误!无法识别文本”之外,我没能让它正常工作,即使只有几个示例页面(111KB)。

我将非常感激任何关于我在那个网站上做错什么的建议(或者如何获取那里的任何帮助!)或指出其他(免费!)适用于阿拉伯语文本的选项(最好不需要注册或大量下载)。有人愿意帮忙吗?

请注意,此 .pdf 没有文本层。

答案1

因为问题不是要求推荐最好的程序(可能与主题无关),而是要求新的 OCR 能够按照预期的方式工作,或者任何其他适用于阿拉伯语文本的免费转换器,我认为可以公平地说OCR转换是一个答案。这是在线的、免费的,不需要注册。

它无法一次性处理所有 67 页(大约 15 分钟后程序报告错误),但它一次转换了 10 页。质量/准确性值得怀疑(基于使用 Google 的翻译),但我很乐意将其视为一个单独的问题。

相关内容