OCR 高分辨率图像并在图像压缩后稍后合并 OCR 数据?

OCR 高分辨率图像并在图像压缩后稍后合并 OCR 数据?

我有大量来自 ScanTailor 的 .tif。有没有一种方法可以让我用 tesseract 来 OCR 那些 .tif,将 OCR 数据与图像分开?然后压缩图像,最后将OCR数据与压缩图像结合?

关键是我不想在 OCR 之前进行压缩,并且稍后压缩 pdf 并保留 OCR 的工具并不好。

相关内容