将不同的 Latex 样式转换为单一格式

将不同的 Latex 样式转换为单一格式

我正在做一个将科学公式图像转换为 Latex 字符串的项目。

在开发过程中我发现,同样的公式,我们有不同的方式去传导它的Latex字符串。

例如:

  1. \left(A\right)\frac{125}{300};
  2. \text { (A) } \frac{125}{300} \text {; }
  3. (A)\frac{125}{300};

上面的三个 Latex 字符串描述的是同一个数学公式图像: 在此处输入图片描述

有没有办法将所有不同的 Latex 样式转换为一种格式?如果可能的话,我可以用 CER/WER 指标、准确度等来评估 LatexOCR,或者更精确、更方便地比较不同的 API 服务。

更新:就我而言,我目前想要的是自动比较不同 OCR API 服务之间的渲染输出。但是,如果我只依赖其 Latex 值(由于我上面列出的差异),这是不可能的。当然,当我开发模型并评估内部解决方案时,所有细节都很重要。

相关内容