我可以在 okular 中查看 epub 文件,选择所有文本并复制粘贴到文本编辑器中。我想要一种命令行方法 - 有人知道这样的方法吗?
答案1
我不知道 Calibre 是否值得为您的工作安装,但如果您有它,您可以使用强大的电子书转换器:
ebook-convert input.epub output.txt
输出格式从输出文件扩展名中扣除
我认为可能有一些 XML 工具/脚本(XSLT)可以将 epub 转换为文本,因为 epub 基本上是 ZIP 存档中的 XHTML
答案2
另一种方法是epub转txt作者:凯文·布恩,可在Github。
epub2html 是一个简单的命令行实用程序,用于从 EPUB 文档中提取文本,并可选择重新排列文本以适应特定列数的文本显示。它完全用 ANSI 标准 C 编写。
使用示例:
epub2txt input.epub > output.txt
答案3
答案4
要从终端将 epub 文档转换为纯文本:
pandoc input.epub | lynx --stdin --dump > output.txt
假设pandoc
和lynx
已经安装。