从书籍创建电子书

从书籍创建电子书

我看到网上有很多电子书。它们是如何从书中创建的,还是你实际上是手写的?如果他们从书中捕捉图像,字体如何变得可复制?

答案1

大多数情况下,大师作品都是数字化的,只需将其保存为 pdf 即可(事实上,一些出版商甚至将书籍发布为电子书在实体版本发布之前)

否则,就需要扫描书籍,使用光学字符识别 (OCR)将大部分内容转换为文本,重新校对,并添加回所有图片。字体相当标准,或者使用的字体足够接近标准。

答案2

过去,电子书大多为 PDF 格式,但在 Kindle 上阅读的电子书为 .mobi 格式,在任何其他阅读器上阅读的电子书为 ePub 格式。这两种格式都基于 HTML,即用于网页的标记类型。PDF 有两种形式 - 如果您扫描任何内容,那么扫描件可以转换为 PDF,但那只是文档的图片。重要的是 OCR 过程,它将文档中的文本转换为机器可读的文本 - 您和我在这里使用的文本类型。OCR 并不完美,但有些方法比其他方法更好。一旦文本为机器可读形式,就可以用 HTML 标记并放入 .mobi 或 ePub 格式。

相关内容