我如何下载维基百科数据库的特定集合?具体来说,我有兴趣下载数学门户和计算机科学门户下的所有文章。我该怎么做?
答案1
答案2
您可以使用媒体维基 API。
答案3
你可以*-pages-articles.xml.bz2
从维基媒体备份转储站点并处理它们维基出租车(左上角下载)。Wikitaxi 导入工具将从.taxi
文件中创建一个(对于 Wikipedia 来说大约 15Gb)文件.bz2
。该文件将由 WikiTaxi 程序用于搜索文章。体验与浏览器体验非常相似,包含截至当时所有文章转储,但没有图像。
或者你可以使用奇异果设置速度更快,因为数据库已经建立(但相当旧),但 WikiTaxi 的优势在于您可以获得最新更新的内容。
答案4
转到 en.wikipedia.org 左侧栏,在“工具”下单击“特殊页面”。
在新页面中,在“页面工具”下单击“导出页面”。
在新页面上,输入您想要的每个类别的名称。例如,输入数学(如下图所示)并点击添加。
然后您应该安装 Mediawiki 并转到类似的路径并选择“导入页面”。