我正在尝试对具有两页布局的 PDF 进行 OCR - 在 PDF 的横向页面中,左半部分是一页(纵向),右半部分是下一页(纵向)。有时布局会弄乱 Tesseract。我可以告诉它有关布局的信息,或者在通过 Tesseract 运行之前有效地拼接原始 PDF 吗?
双页布局的 OCR
相关内容
- Bash 脚本无法正确解析远程 SSH 命令
- 如何在 ubuntu 16.04 LTS 64 位版本上安装 libelfg0-dev
- Ubuntu MATE 16.04 和 18.04 的屏幕刷新/重绘问题
- Exchange 2010 SP1 是否在任何地方记录 OWA 登录尝试?
- 混合手动和 GPO 映射驱动器:手动驱动器在注销/打开或重新启动后不会重新连接
- 无法从 USB 启动 Ubuntu
- WD ELEMENTS 1024 无法读取并导致 explorer.exe 崩溃
- 如何连续绘制多个时间线?
- Docker + nginx + Php-FPM 502 错误网关
- Ubuntu 认为我的空间不够了![重复]