如何抓取 epub 文件的第一页?

如何抓取 epub 文件的第一页?
epubcat book.epub 1 3
# outputs plain text of pages 1 through 3

我不知道epub是否有“页面”的概念。如果不是的话,也许我们可以说每400个字符就是一个页​​面?适用于其他电子书格式的通用解决方案更好(mobi、azw3 等)。

我自己的想法目前是首先通过 ebook-convert 或 pandoc 将书转换为文本,然后提取所需的数量,但这似乎效率非常低,因为我只想获取内容的一小部分。

您可以下载可用于测试的示例文件这里

答案1

您可以使用mutool

mutool draw -F text file.epub 1 2>/dev/null

重定向2>/dev/null是可选的。

相关内容