如何从命令行扫描文本文档?

如何从命令行扫描文本文档?

我喜欢这种为文本文档生成小型 PDF 文件的方式simple-scan。唉,自从我升级到 Ubuntu 17.10(现在仍在使用 18.04)以来,按键C-1(扫描 1 页)C-n不再起作用,所以我必须移动鼠标(这很慢),所以我正在寻找替代方案。

通过 scanimage --batch 将多幅扫描的图像编译成 pdf 文件从终端扫描提供一个很好的方法:

$ scanimage --format=tiff | convert tiff:- scan.pdf

唉,文件scan.pdf有 10M - 对于一个被扫描simple-scan164k PDF文件

我尝试了所有的组合:

for mode in gray line; do 
  for format in png tiff jpeg; do 
    scanimage --mode $mode --resolution 300 --format=$format | convert $format:- $mode-$format.pdf
    ls -h $mode-$format.pdf
  done
done

并得到

5.9M gray-png.pdf
11M  gray-tiff.pdf
1.1M gray-jpeg.pdf
288K line-png.pdf
11M  line-tiff.pdf
1.5M line-jpeg.pdf

换句话说,产生合适文件大小的唯一选项是--mode line --format png

但是,那质量扫描结果有很多不足之处(例如,所有线条都是相同的粗细 - 黑色,没有灰度,有很多“污垢”)。gray质量不错,但文件大小却大得离谱。

那么,如何在不使用鼠标的情况下simple-scan以模式将文本文档扫描为 PDF 呢?text

附言:我问的是Unix但没有得到答案。

相关内容