我使用 pdf2djvu 默认选项将 pdf 文件转换为 djvu 文件。生成的 djvu 文件 (6.6MB) 比原始 pdf 文件 (6.4MB) 略大。
- djvu 文件不是应该比 pdf 文件小吗?为什么这里不是这样呢?
- 有没有办法可以在转换后使 djvu 文件变得更小且不丢失重要信息?
感谢致敬!
答案1
1)djvu比PDF大。
据我了解,djvu 是“一种图像压缩技术”。PDF 是一种可移植文档格式。PDF 可以将文本存储为字符串,查看器可以使用外部或嵌入字体呈现这些字符串。PDF 可以包含扫描文本的压缩位图,但这并不是它存储文本的唯一方式。
如果您将文本为字符串+字体的 PDF 转换为 djvu,可能(在某些情况下)字符串必须被栅格化 - 从而增加数据的大小。
如果您可以提供一个展示该行为的小示例 PDF,人们可能会能够更详细地解释。
2)无损压缩
有很多方法可以在不丢失信息的情况下使事物变小. 一些压缩算法比其他算法更有效对于某些类型的数据。
答案2
文件大小的一个原因可能是转换器将许多内容归类为背景层(参见实施细节)。
文档里有任何图形吗?