如何对带有古德国哥特式(Fraktur)文本的 PDF 文件进行 OCR?

如何对带有古德国哥特式(Fraktur)文本的 PDF 文件进行 OCR?

我已经成功地使用 Adob​​e Acrobat X 对许多用于研究的扫描文档进行 OCR。然而,我开始研究使用花体字体,也称为 Gothic。SuperUser 不允许我发布它的图片,但您可以在 Wikipedia 文章(上面有链接)中找到它的示例。

我读过一些可以对文本进行 OCR 处理的特殊程序,例如ABBY FineReader 字体,但首先它可以在 Windows 上运行(我使用 Mac),其次我想找到一个适用于 Acrobat 的 Fraktur 插件以适应我现有的工作流程。是否有适用于 Acrobat 的 Fraktur OCR 插件?通常,应该在哪里查找 Acrobat OCR 插件?

答案1

我不太清楚 Acrobat 的 OCR 插件。不过,它看起来章鱼支持 Fraktur 文本,有人好心地创建了一个 OS X 版本,带有一个简单的 GUI,名为塔科OCR

编辑:参见 Stack Overflow 问题在 Linux 上使用 OCRopus/Tesseract 进行 Fraktur 识别

相关内容