动态自动裁剪扫描图像的黑边吗?

动态自动裁剪扫描图像的黑边吗?

我复印了一本笔记本,然后扫描了复印件,大约 200 页。由于各种原因,我需要打印这份材料。页面边缘(页面本身结束后)有大量黑色区域,即“黑边”。

图像如下所示:

图片

我想删除黑色部分,但保留所有文本。 * 偶数页和奇数页的黑色部分在不同的地方。 * 值得注意的是,黑色部分外面也有白色边缘! * 最值得注意的是,黑色区域没有固定宽度(我尝试过分别叠加偶数页和奇数页的所有图像)。它的宽度变化。批处理算法应该能够检测到它。

有没有办法自动删除这些黑白边距并保留文本?

我可以使用 Windows XP 或 Linux。

答案1

我建议使用一个名为扫描裁缝,它可以去除边框、拉直并对扫描的图像进行其他修复。下面是我在对您的示例文件进行最少输入的情况下得到的结果。虽然很难说它将如何适用于整个批次,但初步结果看起来很有希望。

如果你正在寻找一个真正的脚本解决方案来解决这个问题,你可以尝试使用 ImageMagick,这是一个非常强大的命令行实用程序来处理图像。具体来说,我会看看去除边框和修剪。但是我没能成功处理你的测试图像。你可能需要查看论坛,那里似乎有其他人类似问题

经 Scan Tailor 后期处理的样本图像

答案2

视图具有批处理模式自动裁剪特征:

1

如您所见,可以根据需要修改颜色和容差级别,这可能会有所帮助。

伊凡视界具有类似的功能,尽管它有点隐蔽。Options > Properties/Settings > Browsing/Editing您可以在下方设置自动裁剪边框的容差值:

2

您可以通过以下方式批量自动裁剪File > Batch conversion

3

如果这些都没有帮助,那么您可能不得不使用更强大的工具,例如 Photoshop,或许还需使用适当的自动裁剪插件。

相关内容