双页布局的 OCR

双页布局的 OCR

我正在尝试对具有两页布局的 PDF 进行 OCR - 在 PDF 的横向页面中,左半部分是一页(纵向),右半部分是下一页(纵向)。有时布局会弄乱 Tesseract。我可以告诉它有关布局的信息,或者在通过 Tesseract 运行之前有效地拼接原始 PDF 吗?

相关内容