如何从 PDF 文件中提取原始/最大分辨率的图像?
我一直在尝试不同的方法来导出图像/截图,但最终得到的是体积庞大且细节程度仍低于 PDF 文件的文件。
答案1
您可以使用以下方式从 pdf 文件中提取图像pdfimages
该计划是波普勒图书馆在许多基于 Linux 的操作系统上都以软件包形式提供poppler-utils
。它甚至可以在视窗. 请参阅手册页pdfimages
了解可用选项。
此命令列出 PDF 文件中嵌入的图像:
pdfimages -list sample.pdf
page num type width height color comp bpc enc interp object ID x-ppi y-ppi size ratio
--------------------------------------------------------------------------------------------
1 0 image 4960 7008 gray 1 1 jbig2 no 6 0 600 600 132K 3.1%
2 1 image 4960 7008 gray 1 1 jbig2 no 11 0 600 600 40.4K 1.0%
3 2 image 4960 7008 gray 1 1 jbig2 no 15 0 600 600 26.3K 0.6%
提取图像:
pdfimages -j -png sample.pdf sample
这将提取原始 JPEG 格式的所有 JPEG 图像,其他图像将默认为无损 PNG 格式,因此您最终会得到如下文件:
sample-000.jpg
sample-001.jpg
sample-002.png
sample-003.png
在极少数情况下,如果你无法安装任何软件,你可能需要尝试在线服务,例如pdf 提取工具。