如何处理文档图像使其看起来像扫描件?

如何处理文档图像使其看起来像扫描件?

假设我用智能手机相机拍摄了几张文本文档和演示文稿的照片。由于光线不均匀,这些照片的颜色和亮度都有渐变。而且,照片中的背景(纸张)颜色不是纯白色(也是因为光线的原因)。

现在,我想处理这些照片(最好使用 ImageMagick),使它们看起来像是扫描的。能够做到这一点的应用程序的一个很好的例子是 CamScanner(在安卓iOS)。但是,我正在寻找一种解决方案,以便在我的 Windows PC 上实现类似的结果。

对于黑白文档,我找到了一个很好的 ImageMagick 脚本:

magick.exe convert input.png -auto-orient -colorspace gray ( +clone -blur 15,15 ) -compose Divide_Src -composite -normalize -threshold 80% output.png

来源:批量处理文档图像,使其看起来像传真件

现在,我正在寻找一个可以处理彩色文档(即在输出中保留颜色)的脚本。CamScanner 中的相应过滤器是“Magic Color”。

例子:

此输入图像

输入

被输入到 CamScanner 中,输出图像如下

输出

产生了。而且,我无需任何干预就获得了这个结果。我只是拍摄了照片,然后自动生成了输出图像。

我正在寻找可以在我的 Windows 计算机上执行类似操作的解决方案。

注意:我并不期望找到一种可以自动检测边框并进行相应裁剪的简单解决方案。但是,如果您知道解决方案,也请将其包括在内。

编辑:我对此进行了实验,发现 -threshold 负责使输出图像变成黑白。但是,如果我不使用 -threshold,则生成的图像的文件大小将大 50 倍(对于上面示例中包含的输入图像)。我认为造成这种情况的原因是图像在使用 -threshold 之前最初没有纯白色背景,这使得 PNG 压缩效果较差。使用 -threshold 后,背景变为纯白色,因此 PNG 压缩变得更加有效。因此,我正在寻找一种解决方案,使背景变为纯白色,而不会导致图像变成黑白。

此外,无论我是否使用 -threshold,输出图像中表格标题行的清晰度都不是很好。因此,我正在寻找一种解决方案来提高标题行的清晰度(类似于使用 CamScanner 实现的解决方案)。

相关内容