我正在做一个将科学公式图像转换为 Latex 字符串的项目。
在开发过程中我发现,同样的公式,我们有不同的方式去传导它的Latex字符串。
例如:
\left(A\right)\frac{125}{300};
\text { (A) } \frac{125}{300} \text {; }
(A)\frac{125}{300};
有没有办法将所有不同的 Latex 样式转换为一种格式?如果可能的话,我可以用 CER/WER 指标、准确度等来评估 LatexOCR,或者更精确、更方便地比较不同的 API 服务。
更新:就我而言,我目前想要的是自动比较不同 OCR API 服务之间的渲染输出。但是,如果我只依赖其 Latex 值(由于我上面列出的差异),这是不可能的。当然,当我开发模型并评估内部解决方案时,所有细节都很重要。