我有一些扫描的 PDF 文件,我想使用 ScanTailor 进行处理。为此,我需要提取图像(作为 TIFF)。我一直在使用 GhostScript,如下所示:
gs -sDEVICE=tiffgray -r400x400 -dNOPAUSE -dBATCH -sOutputFile="file0000.tiff" "input.pdf"
问题是我不知道 PDF 中原始图像的分辨率是多少。有没有办法让 GhostScript 根据 PDF 文件中的图像调整其分辨率?或者有没有其他可以做到这一点的免费 Linux 软件?
Adobe Acrobat这样做:
色彩空间/解决指定输出文件的色彩空间和分辨率。您可以让 Acrobat 自动确定这些设置。
答案1
poppler-utils 中的 pdfimages 可从 pdf 文件中提取图像,它会将单色图像保存为 PBM,将非单色图像保存为 PPM,但您可以让它输出 jpg。如果这不适合您,那么您可以使用 pdfimages -list 获取图像列表及其信息(包括分辨率)。