如何将 .epub 文件转换为纯文本?

如何将 .epub 文件转换为纯文本?

我可以在 okular 中查看 epub 文件,选择所有文本并复制粘贴到文本编辑器中。我想要一种命令行方法 - 有人知道这样的方法吗?

答案1

我不知道 Calibre 是否值得为您的工作安装,但如果您有它,您可以使用强大的电子书转换器:

ebook-convert input.epub output.txt

输出格式从输出文件扩展名中扣除

我认为可能有一些 XML 工具/脚本(XSLT)可以将 epub 转换为文本,因为 epub 基本上是 ZIP 存档中的 XHTML

答案2

另一种方法是epub转txt作者:凯文·布恩,可在Github

epub2html 是一个简单的命令行实用程序,用于从 EPUB 文档中提取文本,并可选择重新排列文本以适应特定列数的文本显示。它完全用 ANSI 标准 C 编写。

使用示例:

epub2txt input.epub > output.txt

答案3

多媒体PDF可以将 转换为epubhtmltxt要安装它:

sudo apt install mupdf mupdf-tools

使用方法:

mutool convert -o somefilename.txt somefilename.epub 

它假定txt来自选项的输出-o

mutool convert 文档了解更多信息。

答案4

要从终端将 epub 文档转换为纯文本:

pandoc input.epub | lynx --stdin --dump > output.txt

假设pandoclynx已经安装。

相关内容