为什么使用 Calibre 转换后的 PDF 不再可搜索,并且从中“复制”的文本是乱码?

为什么使用 Calibre 转换后的 PDF 不再可搜索,并且从中“复制”的文本是乱码?

我正在尝试使用 Calibre 将 mobi 和 epub 格式转换为 pdf,并且可以用于阅读,但是存在一些问题。

也就是说,字符编码似乎乱了套。搜索文本永远找不到任何匹配项,即使搜索的文本“在”文档中。从文档中复制的文本如下所示:

ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@ˆ@

实际上,当我将它复制到这里时,它是“不可见的”字符,但上面是它复制到 VIM 中时的样子。

如何让 Calibre 在转换为 PDF 时不出现这些问题?

答案1

正如我发现的此链接、方法一:

1)使用 calibre 转换为 HTMLZ。

2)将文件的扩展名 .htmlz 替换为 .zip

3)解压缩文件

4)使用 Adob​​e Acrobat Pro 的“从网页创建”功能创建 PDF

方法 2:

如果您正在寻找一种快速解决方案并且不介意牺牲内部链接,只需在 Mac OS 预览中打开 Calibre 生成的 PDF,转到打印对话框,然后从那里“另存为 PDF”。这将生成一个可搜索的 PDF,其中包含可复制的内容,但缺少内部链接。

还有更多解决方案此链接,但我自己也搞不清楚。

相关内容