下载维基百科

下载维基百科

我如何下载维基百科数据库的特定集合?具体来说,我有兴趣下载数学门户和计算机科学门户下的所有文章。我该怎么做?

答案1

您可以使用一个名为奇异果,使用起来非常方便。

编辑

维基百科提供了一个工具来提取其内容的子集。您可以搜索“数学”这里,然后导出此类别中的每篇文章。您将获得一个 .xml 文件,您可以使用列出的工具之一浏览该文件这里

答案2

您可以使用媒体维基 API

答案3

你可以*-pages-articles.xml.bz2维基媒体备份转储站点并处理它们维基出租车(左上角下载)。Wikitaxi 导入工具将从.taxi文件中创建一个(对于 Wikipedia 来说大约 15Gb)文件.bz2。该文件将由 WikiTaxi 程序用于搜索文章。体验与浏览器体验非常相似,包含截至当时所有文章转储,但没有图像。

或者你可以使用奇异果设置速度更快,因为数据库已经建立(但相当旧),但 WikiTaxi 的优势在于您可以获得最新更新的内容。

答案4

转到 en.wikipedia.org 左侧栏,在“工具”下单击“特殊页面”。

在新页面中,在“页面工具”下单击“导出页面”。

在新页面上,输入您想要的每个类别的名称。例如,输入数学(如下图所示)并点击添加。

在此处输入图片描述

然后您应该安装 Mediawiki 并转到类似的路径并选择“导入页面”。

相关内容