如何从 PDF 文件中提取原始/最大分辨率的图像？

Question

您可以使用以下方式从 pdf 文件中提取图像pdfimages该计划是波普勒图书馆在许多基于 Linux 的操作系统上都以软件包形式提供poppler-utils。它甚至可以在视窗. 请参阅手册页pdfimages了解可用选项。

此命令列出 PDF 文件中嵌入的图像：

pdfimages -list sample.pdf

page   num  type   width height color comp bpc  enc interp  object ID x-ppi y-ppi size ratio
--------------------------------------------------------------------------------------------
   1     0 image    4960  7008  gray    1   1  jbig2  no         6  0   600   600  132K 3.1%
   2     1 image    4960  7008  gray    1   1  jbig2  no        11  0   600   600 40.4K 1.0%
   3     2 image    4960  7008  gray    1   1  jbig2  no        15  0   600   600 26.3K 0.6%

提取图像：

pdfimages -j -png sample.pdf sample

这将提取原始 JPEG 格式的所有 JPEG 图像，其他图像将默认为无损 PNG 格式，因此您最终会得到如下文件：

sample-000.jpg
sample-001.jpg
sample-002.png
sample-003.png

在极少数情况下，如果你无法安装任何软件，你可能需要尝试在线服务，例如pdf 提取工具。

Answer 1