图像后期处理:Unpaper

图像后期处理:Unpaper

我尝试取消纸质文件工作,这是一个非常强大的工具,可以对扫描的书页进行后期处理。我阅读了文档,但仍然无法让它在 Windows 和 Linux 上运行。我的图片是使用 Gimp 转换为 .pbm 格式的位图(也尝试了 pgm 和 pnm)。然后我使用这个命令:

unpaper -l double --pre-rotate -90 inputFile.pbm outputFile.pbm

(-l double 表示一张纸上有 2 页,而 --pre-rotate -90 将图像向左旋转)

它应该做这样的事情:

在此处输入图片描述

但我的输出文件与输入没有区别,只是旋转了。

答案1

我终于找到了问题所在。问题在于 Gimp (v2.6.11) 转换为 .pbm 格式。转换后的文件不是二进制文件(只有白色或黑色像素),而 Wikipedia 则说“PBM 适用于位图(黑白,无灰色)“所以我用图像魔术师进行转换,现在 unpaper 工作得很好,而且我使用 tesseract 3 获得了优异的结果。

相关内容