如何将两列 OCR PDF 格式化为一列

如何将两列 OCR PDF 格式化为一列

我在 Kindle 上阅读 PDF 时遇到了麻烦,因为 OCR 文本每页显示两列。(例如,这本书一次扫描两页,然后进行 OCR。)我该如何将其格式化为一列(或任何样式),以便可以在 Kindle 上阅读?

答案1

最新版本的 k2pdfopt 可以保留 OCR 功能原生 PDF 输出选项(-mode 2col)或使用以下方法恢复 OCR自己的 OCR。此外,正如一些人建议的那样,如果您在 k2pdfopt 中使用正确的设置,则无需通过 Calibre 运行 k2pdfopt 输出。

编辑:2013 年 9 月 3 日发布的 k2pdfopt v2.x 版将默认保留之前经过 OCR 处理的文本,即使未在原生 PDF 输出模式下使用(例如重新流动文本时)。

答案2

成立本指南。 基本上使用k2pdfopt将两列转换为一列。然后通过 Calibre 运行以获得更清晰的版本。

这只是部分解决方案,因为它消除了 OCR 的优势。生成的文件只有图像,因此非常大。

相关内容