我有许多旧的扫描 PDF,它们占用了太多磁盘空间。
我尝试过网上许多 PDF 压缩器。它们都问我彩色图像该用什么压缩,单色图像该用什么压缩;但我找不到任何可以将所有内容转换为二进制图像的工具。
二进制是指每个像素只能具有两个颜色值之一:全黑或全白。我知道我的所有 PDF 都有黑白文本(甚至没有灰度)。某些工具(Windows、Linux 或 Android)可以使用此知识来实现更好的压缩吗?
我不确定,但 Adobe Acrobat Pro 中的“优化 PDF”工具可能可以满足我的要求。不过,即使它能满足我的要求,我也希望了解一款更便宜、更紧凑的应用程序。
答案1
jbig2 压缩是减少文件大小的最佳方法
Adam Langley 最初为 googlebooks 编写了 jbig2enc 编码器
然后发布源代码,以便任何人都可以构建
当然,您也可以使用预编译的二进制文件:
- https://code.google.com/p/pdfrecompressor/downloads/list
- 或者尝试修改构建(可以使用 -P 开关,你可以决定每个词典要包含多少页,这样生成的 pdf 响应更快)我为我的系统构建的版本可以与你的系统兼容
Jbig2enc+ akrykukov 补丁
塞萨洛尼基-pdf.py还需要 thessalonica-pdf.py
jbig2enc 的常用语法是(假设您的文件是 tiff)
jbig2 -s -p -v *.tiff && pdf.py output >out.pdf
但对于Jbig2enc+ akrykukov 补丁
jbig2 -s -p -v -P (number of pages for dictionary) *.tiff && thessalonica-pdf.py *.jbig2 >out.pdf
重要的:
你需要 Python 库来收集并整理所有 jbig2 生成的文件到 PDF 中