我想从prc
Linux 下的 (无 DRM) 文件获取所有文本。有没有什么工具可以做到这一点?解压epub
文件只是一个prc
,所以我希望也有类似的prc
文件技巧/工具。
答案1
您实际上看到的是 PalmOS“可执行”文件格式,由于我无法理解的原因,它已被重新用作“Mobipocket”的电子书格式。请参阅这里了解文件格式的背景和低级描述。
因为你断言源文件是不是DRMed,这意味着所有文本都以可转换的格式保存在某个地方。因此,您只需要一个库来正确读取数据。
我最喜欢的 Linux 程序是用于在不同的电子书格式之间进行转换(或完全转换电子书格式)的程序口径——它确实支持未加密的prc
文件。
如果 Calibre 本身无法将文本提取为您可以使用的格式,而只能将其转换为您无法使用的格式,那么我建议您查看 calibre 用作依赖项来读取prc
文件的低级库。然后,您可以使用该库中的示例代码来开发一个工具,以高级别读取 PRC 数据,确定文本的位置,并将其写入文件。如果您是开发人员,这应该相当简单。
这是个好问题。+1。
答案2
KindleUnpack效果很好。可从 GitHub 下载。
也可以看看:KindleUnpack (MobiUnpack):从 Kindle/Mobi 文件中提取文本、图像和元数据在 MobileRead 论坛。