我有一个 PDF,每页都是全彩色图像(这是一本画册)。一共有 16 页。其中有一页完全是空白的。
PDF 本身有 140 MB。当我将每张图片提取为 BMP 时,这些图片仅占用 30 MB。无损压缩为 PNG 则占用 13 MB。
图像本身(最多也只有) 30 MB,PDF 怎么可能只有 140 MB?PDF 是否使用了一种极其低效的方式来存储图像数据,其中每个像素占用超过 4 个字节?
我喜欢 PDF,因为很多应用程序都支持它,而无需安装额外的软件/插件,但我发现这很奇怪。
我不确定这个特定的 PDF 是否只是一个特例。
答案1
你用什么软件“提炼”来自 pdf 的图像?
请记住,要以原始分辨率从 pdf 中提取图像,您需要使用
pdf图像
您可以在此处下载适用于 Microsoft Windows 和 Linux 的二进制文件
用法:
pdfimages [options] <PDF-file> <image-root>
一旦你提取出完整分辨率的图像,你就可以正确评估你认为存在的问题
对于彩色图像,一般来说,pdf 只有一种有效的压缩方法来保持质量并减小文件大小
这jpeg-2000
因此,您需要使用能够转换为的软件对从 pdf 中提取的图像进行重新编码,并使用 pdfimagesjpeg-2000喜欢:
- 图像魔法
- 图形魔法
- 好多其它的
然后,您需要将这些 jpeg-2000 编码的图像放入 pdf 中,而无需重新编码。这可以在 Microsoft Windows 和 Linux(使用 Wine)中完成,使用以下命令:
免费图片转pdf