如何将整个 XML 转储从 Wikia 转换为 Kindle?

如何将整个 XML 转储从 Wikia 转换为 Kindle?

我想将整个 Deus Ex Wikia 的 XML 转储转换为我的 Kindle。我该怎么做?

如果有人想在发布答案之前尝试他们的解决方案,这里是压缩的 XML 文件: http://dumps.wikia.net/e/en/endeusex/pages_current.xml.gz

答案1

看起来你可以这样做移动口袋

从 XML 构建

答案2

我不知道你的 Wiki 系统,但如果它可以导出为 PDF 而不是 XML,那么口径是一种可以将 pdf 转换为几乎任何电子书格式的工具。

答案3

我找到了一种不费吹灰之力就能完成此操作的方法。我设置了自己的 Mediawiki 安装并导入了 XML(我需要增加 PHP 配置中的限制 - 有关最大执行时间和上传文件大小的限制)。这在我的上网本上花费了相当多的时间。在结果页面上,我可以复制页面列表,然后用来egrep -v过滤掉非内容页面,例如用户个人资料、讨论、模板等。

然后我安装了EPub导出。我访问了Special:EpubPrint页面并复制了过滤后的页面列表。生成电子书花了很长时间,然后将 EPUB 转换为 .mobi 又花了两个小时。输出文件长得可疑(我怀疑用户写的内容是否和 Mitchell 在《云图》一书中写的内容一样多),但从预览来看,它看起来是合法的。不过,它缺少图像,因为它们不在 XML 中。我会在有更多空闲时间时阅读它,并让你知道它从长远来看是如何工作的。如果你想自己阅读电子书,可以在这里。您需要跳转到“Deus Ex”文章,因为我忘记从输出文件中剪切索引页了。

相关内容