混合数学和文本的 OC 文档

2024-11-30 • tag-icon

我有一份包含数学方程式的文档，我想用谷歌翻译将其翻译成另一种语言。如果这是一份带有图片的文本文档，我会使用任何 OCR 软件，将文本复制粘贴到谷歌翻译中，并忽略图片。本文档有所不同，因为：

由于方程式部分为文本，因此可能被 OCR 部分识别，但如果方程式没有完全按原样再现（例如，简单地将下标改为上标就会改变含义），文章的含义就会发生变化。
数学有几百种，所以处理数学的过程必须可靠（在某种意义上）。

所以我的想法是尝试编写一个可以对文本进行 OCR 处理的脚本。至于方程式，找到某种方法将它们自动转换为图像，并在使用谷歌翻译翻译后将这些图像自动插入字符串之间。使用荧光笔快速将数学从文本中屏蔽掉（见下文）。我想我可以使用终端图形程序中的黄色蒙版来选择被屏蔽的区域，并自动将这些区域分离成小的单个图像。

我的问题是：

是否存在可以完成整个过程而无需我自己编写任何代码的软件？如果没有：
我如何才能从文本中提取每个字符串，并自动记录哪个字符串位于哪个图像之前？这样，它们就可以在 OCR+翻译之后重新组合在一起。

相关内容