我有一份 pdf 目录,是客户给我的,是 pdf 格式的。他们没有图片,但 pdf 里有图片。
有没有办法使用命令行工具从 pdf 中提取所有图像,同时保留其原始文件名?
我在这里回顾了这个问题:使用图层蒙版从 PDF 中提取图像 但它适用于单独的图像。
答案1
pdfimages
软件包中的程序poppler-utils
可能就是您要找的。从手册页中:
Pdfimages 读取 PDF 文件 PDF 文件,扫描一页或多页,并为每个图像写入一个 PPM、PBM 或 JPEG 文件。
在较新版本上poppler-utils 有一个all
提取为 jpg 或 png 的开关:
pdfimages -all input.pdf images/prefix
将以以下形式输出文件前缀-nnn.[png|jpg]在里面图片文件夹。