答案1
我写执行此操作的脚本很久以前。它本质上是围绕几个执行繁重工作的实用程序的粘合代码。我的脚本和当时其他工具之间的区别在于,我的脚本是唯一一个执行以下所有操作的脚本:
- 压缩率与原始 DjVu 文件相似(大小为 1.5-2 倍,而不是 10-20 倍)
- 保存的书签/目录元数据(用于在 pdf 阅读器中导航)
- 保留嵌入的文本层以供搜索
话虽如此,它还是很原始。我只是确保它对我的所有文件都适用,之后就再也没有使用过它。
答案2
我打包了温德瓦基的脚本连同所需的依赖项一起放入 docker 镜像中。你可以尝试以下方法:
docker run --rm -u $(id -u):$(id -g) -v $(pwd):/opt/work ilyabystrov/djvu2pdf filename.djvu filename.pdf
查看djvu2pdf-docker了解详情。
答案3
这DjVu 到 PDF 转换器如果原始 DjVu 可搜索,则绝对保留单词可搜索性。它还会生成比 calibre 更小的输出文件。
答案4
你有没有尝试过口径? 这Calibre 的贡献者提到支持 djvu 中的 OCR 文本。因此它可能可以转换为带有可搜索文本的 PDF。