我有一个重要的 pdf,我需要提取源图像,尽可能无损(例如使用 png)出于某种原因,源图像似乎是由 226 个图像条纹组成的,当我提取这些图像条纹时,例如使用
pdfimages -png name.pdf out-
我得到了 227 个细小条纹。这不是我想要的。有没有办法得到一张图像?使用pdfimages-列表告诉我关于条纹的信息,并使用例如上面的pdfimages -png 名称.pdf out-给我 227 张单张图片。例如,一张图像的宽度为 1604 像素,高度为 5 像素。据我检查,所有图像的高度似乎都是 5 像素,而对于 227 张单张图片,我应该得到一张 1604 x 1135 像素的单张图片。
更新 我忘了补充 Ryan J. Yoder 下面写的内容也是我自己对这个问题的看法,这意味着 pdf 确实是通过将原始图像分成 227 个条纹创建的。
总而言之,如果是这样的话(pdfimages-列表说是这样的)有没有办法自动从条纹中创建一幅图像,例如通过使用 graphicsmagick。
答案1
Ghostscript 可用于获取页面在查看器中显示的图像,例如,分辨率.png
为 300 dpi 的图像,名为out_001.png
、out_002.png
、...,来源为in.pdf
:
gs -q -dBATCH -dNOPAUSE -sDEVICE=png16m -r300 -sOutputFile=out_%03d.png in.pdf
答案2
您可以使用 ImageMagick 通过命令行将 PDF“转换”为 png:
convert -density 300 page.pdf page.png
或您想要的任何密度(DPI)。