为什么嵌入图片的 PDF 大小比单个图片本身大这么多

为什么嵌入图片的 PDF 大小比单个图片本身大这么多

我有一个 PDF,每页都是全彩色图像(这是一本画册)。一共有 16 页。其中有一页完全是空白的。

PDF 本身有 140 MB。当我将每张图片提取为 BMP 时,这些图片仅占用 30 MB。无损压缩为 PNG 则占用 13 MB。

图像本身(最多也只有) 30 MB,PDF 怎么可能只有 140 MB?PDF 是否使用了一种极其低效的方式来存储图像数据,其中每个像素占用超过 4 个字节?

我喜欢 PDF,因为很多应用程序都支持它,而无需安装额外的软件/插件,但我发现这很奇怪。

我不确定这个特定的 PDF 是否只是一个特例。

答案1

你用什么软件“提炼”来自 pdf 的图像?

请记住,要以原始分辨率从 pdf 中提取图像,您需要使用

pdf图像

您可以在此处下载适用于 Microsoft Windows 和 Linux 的二进制文件

用法:

pdfimages [options] <PDF-file> <image-root>

一旦你提取出完整分辨率的图像,你就可以正确评估你认为存在的问题

对于彩色图像,一般来说,pdf 只有一种有效的压缩方法来保持质量并减小文件大小

jpeg-2000

因此,您需要使用能够转换为的软件对从 pdf 中提取的图像进行重新编码,并使用 pdfimagesjpeg-2000喜欢:

  • 图像魔法
  • 图形魔法
  • 好多其它的

然后,您需要将这些 jpeg-2000 编码的图像放入 pdf 中,而无需重新编码。这可以在 Microsoft Windows 和 Linux(使用 Wine)中完成,使用以下命令:

免费图片转pdf

相关内容