我正在寻找一种将包含黑白文本扫描的 pdf 文件无损、可靠且压缩地转换为 djvu 格式的方法。该工具必须是命令行程序,这样我才能简化转换。我找到了它,djvulibre
但我无法使它与我的 ubuntu linux 上所需的驱动程序一起工作(由于许可证问题,它们似乎是分开的)。pdf2djvu
有调整图像压缩损失级别的选项,但我不确定它是否总是能正确检测源文件的分辨率,所以我担心它可能会因图像重新采样而造成损失。非常欢迎对其他软件、驱动程序问题的解决方案djvulibre
或正确使用的任何提示pdf2djvu
。
答案1
您可以使用 xpdf 从 PDF 文件中提取扫描图像
然后使用 imagemagick 将每个图像转换为 pbm 格式:
convert page-000.png page-000.pbm
然后使用 djvulibre 将你的 pbm 图像转换为 djvu 页面。
cjb2 -clean page-000.pbm page-000.djvu
最后将新页面添加到最终文档
djvm -i page.djvu page-000.djvu
该过程部分解释如下: 创建DjVu文件