我使用 tessract-ocr:
var image = new Bitmap(@"C:/Users/toshiba/Desktop/lettre.jpg");
var ocr = new Tesseract();
ocr.Init(@"C:\Users\toshiba\Desktop\ravo\tessdata", "eng", false);
ocr.SetVariable("load_system_dawg", 0);
ocr.SetVariable("load_freq_dawg", 0);
ocr.SetVariable("load_punc_dawg", 0);
ocr.SetVariable("load_unambig_dawg", 0);
ocr.SetVariable("load_bigram_dawg", 0);
ocr.SetVariable("load_fixed_length_dawgs", 0);
var result = ocr.DoOCR(image, Rectangle.Empty);
foreach (tessnet2.Word word in result)
{
Console.WriteLine(word.Text);
//File.AppendAllText("", word.Text);
}
我收到了信件,但它看起来与图片上的文字不同。这是怎么回事?
答案1
tessract-ocr 无法正确读取文字。这可能是由于字体不同或图像质量不佳造成的。