如何训练 tesseract 忽略拼写和语法错误检测添加的波浪线？

Question

我目前正在尝试学习如何教授 tesseract（我不知道如何创建 lstm 文件进行训练），但我知道你可以对训练过的数据进行微调。我使用jTessBoxEditor为了纠正 tesseract 在 OCR 过程中所犯的错误，我还没有找到以训练的形式实现更改的方法，但我认为该工具正是您所需要的。

使用 jTessBoxEditor，您可以看到图片上的 OCR 是如何完成的，也可以对其进行编辑，但我仍然不知道如何实施训练（仍在等待论坛和这里的回复），所以我无法提供更多帮助，因为我只能做到这些，而且我也不指望有人能回答您的问题，因为这个问题已经存在 2 年了，所以您的设置可能已经过时了。我正在尝试使用 tesseract-ocr 4.*，新版本的教学发生了很大变化，但工具也在不断发展，因此您的问题可以通过 jTessBoxEditor 解决，但我不知道如何实施，所以这不是真正的答案，而只是部分答案。

我希望我能帮到你，哪怕只是一点点。

Answer 1

我目前正在尝试学习如何教授 tesseract（我不知道如何创建 lstm 文件进行训练），但我知道你可以对训练过的数据进行微调。我使用jTessBoxEditor为了纠正 tesseract 在 OCR 过程中所犯的错误，我还没有找到以训练的形式实现更改的方法，但我认为该工具正是您所需要的。

使用 jTessBoxEditor，您可以看到图片上的 OCR 是如何完成的，也可以对其进行编辑，但我仍然不知道如何实施训练（仍在等待论坛和这里的回复），所以我无法提供更多帮助，因为我只能做到这些，而且我也不指望有人能回答您的问题，因为这个问题已经存在 2 年了，所以您的设置可能已经过时了。我正在尝试使用 tesseract-ocr 4.*，新版本的教学发生了很大变化，但工具也在不断发展，因此您的问题可以通过 jTessBoxEditor 解决，但我不知道如何实施，所以这不是真正的答案，而只是部分答案。

我希望我能帮到你，哪怕只是一点点。

如何训练 tesseract 忽略拼写和语法错误检测添加的波浪线？

答案1

相关内容