PDF:检测并裁剪多页?

PDF:检测并裁剪多页?

我在大学里用高速扫描仪将一本书的某些部分扫描成 PDF。扫描仪生成的 PDF 文件只是文档相机拍摄的图像,原封不动地保存下来。换句话说,我们有 30 页 PDF,相当于 60 页印刷品。

该机器能够进行大尺寸扫描,因此其扫描面积比普通书籍大得多。这意味着图像也有很多边框。桌子是黑色的,页面明显是白色的,所以软件似乎应该能够自动裁剪。

我正在寻找某种解决方案浏览 PDF 并提取两页并删除它们周围的边框,然后生成修复结果的新 PDF换句话说,我想要一个 60 页的 PDF,并删除边框。我计划将处理后的 PDF 通过 ABBYY FineReader 进行 OCR。

有人知道如何做到这一点吗?

答案1

这些免费工具看起来很适合您的目的:扫描裁缝或者图书扫描仪

如果您可以使用 Adob​​e Acrobat,我就是这样做的。基本工作流程是将图像合并为 PDF,一次性裁剪所有页面的额外黑色空间,复制每页,分两批裁剪偶数页和奇数页以将其减半,然后进行 OCR。

相关内容