将网页转换为电子书文件

将网页转换为电子书文件

我想要下载 HTML(例如:http://www.brpreiss.com/books/opus6/) 并将其合并到一种 HTML 或其他可在电子书阅读器上使用的格式。提供免费书籍的网站没有标准分页,它们不是博客或论坛,因此不知道如何进行自动抓取和合并。

答案1

您可以使用口径满足您的电子书转换需求。您可以通过将您设置为目录的单个 HTML 文件链接到多个 HTML 文件,将其制作成一本电子书像这样

答案2

我以前用的是 Calibre 来实现这个功能。

但这太麻烦了,因此我构建了一个 Chrome 扩展程序来使其变得更容易。

它被称为 EpubPress(http://epub.press)。

它允许您从 Chrome 标签创建电子书。

希望有帮助!

答案3

潘多克可以获取某个页面(或 html 文件)的链接并将其转换为 pdf/epub ...

我不确定它是否会抓取。如果不行,你可以先使用以下方法抓取页面获得或其他东西(或者只是收集链接)并将其提供给 pandoc。

答案4

HTTrack 是一个不错的选择 - 它可以从一个网站构建一本电子书:可以从这里下载: https://www.httrack.com/ HTTrack“允许您将万维网站点从互联网下载到本地目录,递归构建所有目录,将 HTML、图像和其他文件从服务器传输到您的计算机。HTTrack 会安排原始网站的相对链接结构。”

然后,您可以使用 Calibre 或任何其他 HTML 到 epub 转换软件将 HTML 转换为 EPUB、AZW3 或 PDF。

直接转换为 EPUB 的第二个选项是 EpubPress:它具有允许从 Firefox(仅限 v44.0+)或 Chrome 使用的扩展。要使用此软件,您需要打开浏览器窗口。每个选项卡本质上都是电子书中的一个“章节”。按所需的显示顺序排列选项卡,然后激活 epubpress - 它将下载并按显示顺序排列选项卡,格式为 .epub。希望这对您有所帮助!

*但是,请注意,EpubPress 下载的是离散网页,而不是“网站”,HTTrack 会下载。要使用 EpubPress 下载网站,您必须将网站上的每个链接作为单独的选项卡打开,然后使用 Epubpress 将这些链接收集为 .epub 格式。

相关内容