如何将图像 PDF 文件保存为图像？

Question 1

请密切关注pooryorick 的回答，他指出sleske 的回答对于这个特定问题来说实际上是一个更好的答案。

使用GhostScript。这个命令对我有用：

gs -dBATCH -dNOPAUSE -sDEVICE=png16m -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -r150 -sOutputFile=output%d.png input.pdf

png 伪设备有多种，根据颜色深度进行区分：pngmono、pnggray、png16、png256、png16m 和 pngalpha。选择最适合您的一种。

您也可以使用 jpeg，但除非您有磁盘空间问题，否则您希望 OCR 的质量尽可能高，而 jpeg 并不是最佳选择。

GhostScript 不再支持 gif，但我无法想象为什么你需要它，因为它支持 png256。

Answer

请密切关注pooryorick 的回答，他指出sleske 的回答对于这个特定问题来说实际上是一个更好的答案。

使用GhostScript。这个命令对我有用：

gs -dBATCH -dNOPAUSE -sDEVICE=png16m -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -r150 -sOutputFile=output%d.png input.pdf

png 伪设备有多种，根据颜色深度进行区分：pngmono、pnggray、png16、png256、png16m 和 pngalpha。选择最适合您的一种。

您也可以使用 jpeg，但除非您有磁盘空间问题，否则您希望 OCR 的质量尽可能高，而 jpeg 并不是最佳选择。

GhostScript 不再支持 gif，但我无法想象为什么你需要它，因为它支持 png256。

Question 2

安装Imagemagick. 打开 cmd 窗口或终端：

convert myfile.pdf myfile.jpg

输出将是 pdf 中每一页的 1 个 jpg 文件，test-0.jpg、test-1.jpg 等。

Answer

安装Imagemagick. 打开 cmd 窗口或终端：

convert myfile.pdf myfile.jpg

输出将是 pdf 中每一页的 1 个 jpg 文件，test-0.jpg、test-1.jpg 等。

Question 3

pdf图像能提取嵌入的图像从 PDF 中获取。它不会将整个 PDF 页面转换为图像。它包含在pdf工具或者波普勒工具类。

如果 PDF 包含文本和图像，而您只需要图像，则此功能非常有用。此外，它将以原始格式提取图像，因此不涉及任何质量损失（与渲染整个页面然后将其转换为 JPEG 等的程序不同）。

列出所有图片来自mydocument.pdf：

pdfimages -list mydocument.pdf

将 PDF 中的所有图像提取mydocument.pdf到名为的单独文件中mydocument-image-0000.jpg，mydocument-images-0001.jpg等等：

pdfimages -j mydocument.pdf mydocument-image

选项-j使它将嵌入的 JPEG 压缩图像写入为 JPEG 文件，而不是 PBM/PGM/PPM 文件（未压缩且巨大）。请注意，如果图像在 PDF 输入文件中的存储方式是 PBM/PGM/PPM 文件，则它们仍可能被写入。

如果您使用 Poppler，我建议将其替换为-all以原始格式写入 JPEG、JPEG2000、JBIG2 和 CCITT 图像。CMYK 文件将写入 TIFF 文件。所有其他图像都将写入 PNG 文件。

Answer