我的 PDF 文件中有一个 JPEG 图像,我知道它是 JPEG,因为当我使用十六进制编辑器打开文件时,我可以看到JFIF
其中存在字符串。我如何将其提取到单独的文件中。
我拥有的特定文件仅有一张图片,并且位于第一页。
我知道可以使用convert
Image Magic 包来转换图像,但这意味着将进行双重转换,可能会使图像质量更差或尺寸不必要地变大。
答案1
为了提取图像,需要自动安装pdfimages
。
命令行如下所示:
pdfimages -j file.pdf ./
请注意,斜线是必需的,如果省略,则提取过程将不会发生,也不会生成错误消息。也可以为文件指定一个起始前缀,因为./prefix
这样所有文件都将放在当前目录中,并以提供的前缀开头。
无法限制pdfimages
仅提取单个文件,但可以使用-f
(首页)和-l
(最后一页)选项提供要处理的页面。所有选项必须在输入文件之前提供。