我有一份包含数学方程式的文档,我想用谷歌翻译将其翻译成另一种语言。如果这是一份带有图片的文本文档,我会使用任何 OCR 软件,将文本复制粘贴到谷歌翻译中,并忽略图片。本文档有所不同,因为:
- 由于方程式部分为文本,因此可能被 OCR 部分识别,但如果方程式没有完全按原样再现(例如,简单地将下标改为上标就会改变含义),文章的含义就会发生变化。
- 数学有几百种,所以处理数学的过程必须可靠(在某种意义上)。
所以我的想法是尝试编写一个可以对文本进行 OCR 处理的脚本。至于方程式,找到某种方法将它们自动转换为图像,并在使用谷歌翻译翻译后将这些图像自动插入字符串之间。使用荧光笔快速将数学从文本中屏蔽掉(见下文)。我想我可以使用终端图形程序中的黄色蒙版来选择被屏蔽的区域,并自动将这些区域分离成小的单个图像。
我的问题是:
- 是否存在可以完成整个过程而无需我自己编写任何代码的软件?如果没有:
- 我如何才能从文本中提取每个字符串,并自动记录哪个字符串位于哪个图像之前?这样,它们就可以在 OCR+翻译之后重新组合在一起。