字符使用 tesseract 的错误

字符使用 tesseract 的错误

我使用 tessract-ocr:

 var image = new Bitmap(@"C:/Users/toshiba/Desktop/lettre.jpg");
                    var ocr = new Tesseract(); 
                    ocr.Init(@"C:\Users\toshiba\Desktop\ravo\tessdata", "eng", false);
                    ocr.SetVariable("load_system_dawg", 0);
                    ocr.SetVariable("load_freq_dawg", 0);
                    ocr.SetVariable("load_punc_dawg", 0);
                    ocr.SetVariable("load_unambig_dawg", 0);
                    ocr.SetVariable("load_bigram_dawg", 0);
                    ocr.SetVariable("load_fixed_length_dawgs", 0);
                    var result = ocr.DoOCR(image, Rectangle.Empty);
                    foreach (tessnet2.Word word in result)
                    {
                        Console.WriteLine(word.Text);
                        //File.AppendAllText("", word.Text);
                    } 

我收到了信件,但它看起来与图片上的文字不同。这是怎么回事?

答案1

tessract-ocr 无法正确读取文字。这可能是由于字体不同或图像质量不佳造成的。

相关内容