如何从 prc 文件中提取文本

如何从 prc 文件中提取文本

我想从prcLinux 下的 (无 DRM) 文件获取所有文本。有没有什么工具可以做到这一点?解压epub文件只是一个prc,所以我希望也有类似的prc文件技巧/工具。

答案1

您实际上看到的是 PalmOS“可执行”文件格式,由于我无法理解的原因,它已被重新用作“Mobipocket”的电子书格式。请参阅这里了解文件格式的背景和低级描述。

因为你断言源文件是不是DRMed,这意味着所有文本都以可转换的格式保存在某个地方。因此,您只需要一个库来正确读取数据。

我最喜欢的 Linux 程序是用于在不同的电子书格式之间进行转换(或完全转换电子书格式)的程序口径——它确实支持未加密的prc文件。

如果 Calibre 本身无法将文本提取为您可以使用的格式,而只能将其转换为您无法使用的格式,那么我建议您查看 calibre 用作依赖项来读取prc文件的低级库。然后,您可以使用该库中的示例代码来开发一个工具,以高级别读取 PRC 数据,确定文本的位置,并将其写入文件。如果您是开发人员,这应该相当简单。

这是个好问题。+1。

答案2

相关内容