我在大学里用高速扫描仪将一本书的某些部分扫描成 PDF。扫描仪生成的 PDF 文件只是文档相机拍摄的图像,原封不动地保存下来。换句话说,我们有 30 页 PDF,相当于 60 页印刷品。
该机器能够进行大尺寸扫描,因此其扫描面积比普通书籍大得多。这意味着图像也有很多边框。桌子是黑色的,页面明显是白色的,所以软件似乎应该能够自动裁剪。
我正在寻找某种解决方案浏览 PDF 并提取两页并删除它们周围的边框,然后生成修复结果的新 PDF换句话说,我想要一个 60 页的 PDF,并删除边框。我计划将处理后的 PDF 通过 ABBYY FineReader 进行 OCR。
有人知道如何做到这一点吗?