我有大量来自 ScanTailor 的 .tif。有没有一种方法可以让我用 tesseract 来 OCR 那些 .tif,将 OCR 数据与图像分开?然后压缩图像,最后将OCR数据与压缩图像结合?
关键是我不想在 OCR 之前进行压缩,并且稍后压缩 pdf 并保留 OCR 的工具并不好。
我有大量来自 ScanTailor 的 .tif。有没有一种方法可以让我用 tesseract 来 OCR 那些 .tif,将 OCR 数据与图像分开?然后压缩图像,最后将OCR数据与压缩图像结合?
关键是我不想在 OCR 之前进行压缩,并且稍后压缩 pdf 并保留 OCR 的工具并不好。