我正在尝试使用它unpaper
来处理我拥有的一些 PDF。
但unpaper
似乎每次都只处理第一页。我使用的是 Mac OS X Yosemite。以下是我的处理过程:
我使用 PD 扫描文档预览应用然后,我使用以下 ImageMagick 命令将 .pdf 文件转换为 .pnm:
convert -density 150 document.pdf -depth 8 document.pnm
转换后,我unpaper
在文档上运行:
unpaper document.pnm output.pnm
并将输出转换回 PDF
convert output.pnm output.pdf
但是,output.pdf 只会处理第一页unpaper
,其余部分甚至不会出现在输出中。
丢失页面的原因不是 ImageMagick,而是运行
convert document.pnm test.pdf
输出包含所有页面的 PDF 文件。有什么想法吗?
答案1
如果您的 PDF 确实是多页文档,则输出文件将不会被命名为document.pnm
。相反,您将有多个输出文件,每个 PDF 页面一个。它们将被命名为document-1.pnm
、document-2.pnm
等。
因此,您进一步的处理必须考虑到这一点......
最后,无论何时您准备将 PNM 转换回 PDF,请运行以下命令:
convert output*.pnm output.pdf