epubcat book.epub 1 3
# outputs plain text of pages 1 through 3
我不知道epub是否有“页面”的概念。如果不是的话,也许我们可以说每400个字符就是一个页面?适用于其他电子书格式的通用解决方案更好(mobi、azw3 等)。
我自己的想法目前是首先通过 ebook-convert 或 pandoc 将书转换为文本,然后提取所需的数量,但这似乎效率非常低,因为我只想获取内容的一小部分。
您可以下载可用于测试的示例文件这里。