如何在Linux下扫描一本书的多页?

如何在Linux下扫描一本书的多页?

我希望这个过程看起来像这样:

  1. 我选择了正确的扫描设置(dpi、色彩深度等)
  2. 我把第一页放在扫描仪上,然后触发扫描过程
  3. 扫描仪扫描页面并等待我正确定位下一页
  4. 我确认下一页已准备好扫描
  5. 重复以上两个步骤,直到我告诉扫描仪没有更多页面需要扫描
  6. 扫描仪将所有内容保存为一个 PDF 格式。

我尝试了 xsane 和 gscan2pdf。第一个问题:他们想让我知道要扫描多少页。这已经很麻烦了,但如果需要的话我可以计算一下。

主要问题是,在第 3 步中,扫描仪没有暂停。它可能针对松散纸张进行了优化。一旦 CCD 返回起始位置,就会自动触发下一个扫描过程。扫描仪返回 CCD 所需的时间非常短,我无法翻页并正确定位书籍。

是否有软件可以按照我上面描述的方式执行扫描过程,或者我只是错过了 xsane 或 gscan2pdf 中可用的设置来使扫描仪暂停?

如果有任何区别,扫描仪是 Epson Stylus SX620FW,我使用制造商提供的驱动程序运行它。

答案1

在命令行中,您可以使用scanimage --batch --batch-prompt --source Flatbed来扫描所有页面。遗憾的是,这将留下 .pnm 文件(或 TIFF 文件,如果您添加--format tiff),而不是 PDF。

您不必计算页数——如果有其他页数,它会要求您按 Enter 键,如果没有,它会要求您按 Control-D 键。

然后有几种将 PNM 文件转换为 PDF 的工作流程。最简单的方法是使用 convert(ImageMagick 的一部分):。convert page1.pnm page2.pnm page3.pnm doc.pdf当然,您可以使用 shell(或 ImageMagick)通配符。

您可能希望首先在 pnm 上调用 unpaper。

答案2

我建议扫描器

恐怕它不是免费的。根据版本不同,价格为 40 美元或 80 美元。它可以轻松处理多页扫描以及 OCR 和大量自动和手动优化。

我已经使用它好几年了,最初是为了扫描大量幻灯片,当时我发现原装的佳能幻灯片扫描仪的软件相当垃圾。

VueScan 是跨平台的,可在 Windows、Mac 和 Linux 上运行。

顺便说一句,如果您愿意,VueScan 可以在页面之间暂停,您可以让它暂停一定秒数。

答案3

Gscan2pdf 对我来说很有用,但设置一开始让人困惑。选择“所有”页面似乎没有办法停止扫描过程,而且似乎是为自动文档进纸器设计的。无需预先计算页数。

将其设置为 1,它将扫描并停止。当下一页准备好时,再次按下扫描。所有扫描的页面将累积起来。它可以很好地压缩图像以获得合理大小的最终文件。

相关内容