如何从 PDF 中提取 JPEG

如何从 PDF 中提取 JPEG

我的 PDF 文件中有一个 JPEG 图像,我知道它是 JPEG,因为当我使用十六进制编辑器打开文件时,我可以看到JFIF其中存在字符串。我如何将其提取到单独的文件中。

我拥有的特定文件仅有一张图片,并且位于第一页。

我知道可以使用convertImage Magic 包来转换图像,但这意味着将进行双重转换,可能会使图像质量更差或尺寸不必要地变大。

答案1

为了提取图像,需要自动安装pdfimages

命令行如下所示:

pdfimages -j file.pdf ./

请注意,斜线是必需的,如果省略,则提取过程将不会发生,也不会生成错误消息。也可以为文件指定一个起始前缀,因为./prefix这样所有文件都将放在当前目录中,并以提供的前缀开头。

无法限制pdfimages仅提取单个文件,但可以使用-f(首页)和-l(最后一页)选项提供要处理的页面。所有选项必须在输入文件之前提供。

相关内容