我如何将 djvu 转换为 pdf 并保留单词可搜索性?

我如何将 djvu 转换为 pdf 并保留单词可搜索性?

我有一个 djvu 文件,可以在其中搜索特定单词。但是,如果我将其转换为 pdf(我尝试使用可爱PDF以及在线djvu-pdf工具)中搜索单词的可能性似乎消失了。

如何将 djvu 文件转换为 pdf 并保留单词可搜索性?

答案1

我写执行此操作的脚本很久以前。它本质上是围绕几个执行繁重工作的实用程序的粘合代码。我的脚本和当时其他工具之间的区别在于,我的脚本是唯一一个执行以下所有操作的脚本:

  • 压缩率与原始 DjVu 文件相似(大小为 1.5-2 倍,而不是 10-20 倍)
  • 保存的书签/目录元数据(用于在 pdf 阅读器中导航)
  • 保留嵌入的文本层以供搜索

话虽如此,它还是很原始。我只是确保它对我的所有文件都适用,之后就再也没有使用过它。

答案2

我打包了温德瓦基的脚本连同所需的依赖项一起放入 docker 镜像中。你可以尝试以下方法:

  docker run --rm -u $(id -u):$(id -g) -v $(pwd):/opt/work ilyabystrov/djvu2pdf filename.djvu filename.pdf

查看djvu2pdf-docker了解详情。

答案3

DjVu 到 PDF 转换器如果原始 DjVu 可搜索,则绝对保留单词可搜索性。它还会生成比 calibre 更小的输出文件。

答案4

你有没有尝试过口径? 这Calibre 的贡献者提到支持 djvu 中的 OCR 文本。因此它可能可以转换为带有可搜索文本的 PDF。

相关内容