为什么仅包含一张图片的 PDF 比图像本身大得多?

为什么仅包含一张图片的 PDF 比图像本身大得多?

我想将扫描的文档嵌入到 PDF 文档中。

源图片大约 300 kB。
如果我使用转变命令时,PDF 大小为 30 MB,使用 GIMP 时为 3 MB。

这里是各种命令生成的文件大小。我发现获得合理 PDF 文件大小的唯一方法是先转换为 JPEG,然后再转换为 PDF。

scanimage -p --mode Color --format tiff -x 205 -y 297 > image.tiff      | 25.5
convert -quality 30  -compress Zip image.tiff image-zip.pdf             | 32.2
convert -quality 30   image.tiff image.pdf                              | 12.1
convert -compress Zip image.tiff image-wq-zip.pdf                       | 11.1

convert image.tiff image.jpg                                            | 2.3
convert -quality 30 image.tiff image.jpg                                | 0.34
convert -quality 30 -define jpeg:extent=200kb image.tiff image-200.jpg  | 0.19

convert image-200.jpg image-jpg.pdf                                     | 0.19

答案1

如果您有 JPEG 格式的图像,您可以按照以下简便方法操作。使用 jpeg2ps 包装器转换为 PostScript。然后使用 ps2pdf 转换为 PDF。

答案2

我认为主要原因是 PDF 存储了兼容性设置,这可能会增加文件大小。如果您使用 Adob​​e Acrobat,则可以使用减小 PDF 文件大小并删除这些设置。

或者您可以将图像嵌入到 Word 中。只需插入图像并将文件保存为 PDF,但从“保存类型”菜单中选择 PDF 时,请选择“最小尺寸(在线发布)”。

兼容性设置使得 PDF 能够以合理的质量进行查看和打印,这也许是 PDF 广泛传播的原因。

答案3

PDF 始终具有隐含的纸张尺寸,例如 8.5x11 英寸,并且通常以 250-300ppi 导出。

一张 8.5x11 的纸张大约有 2550x3300 像素。

屏幕的 RGB 彩色图像有 3 个“通道”(灰度图像),而 CMYK 有 4 个。灰度是单通道。

对于“普通图像”,一个像素每个通道为 1 个字节。

因此 2550x3300x3/1024/1024 = RGB 大约 24MB(CMYK 大约 32MB)(未压缩)。

听起来不错。JPEG 压缩可以让你获得更好的效果,但会以牺牲质量为代价,因为它会在压缩过程中破坏数据。

注意将文档图像放在 PDF 容器中 0,0 原点处,页面大小=图像大小,这对您没有任何作用。这就像用一份礼物包装另一份礼物一样。

如果您正在扫描黑白文档,您可以通过不使用 RGB 模式来将尺寸最初减少 1/3。

但请注意,非 rgb Jpeg 图像并非得到普遍支持。

在此处输入图片描述

相关内容