如何创建大型样本数据库?

如何创建大型样本数据库?

我有几个示例数据库,但它们的大小相当小。我想创建一个包含最多 50GB 记录的数据库。我想学习数据库的许多方面,也想用它来测试我们的应用程序的性能。

如何收集随机数据?

答案1

互联网上有许多资源允许您下载其内容,这些资源通常达到数十或数百 GB。我能想到的两个资源是:

尽管这些转储是 XML 格式的,但任何现代 RDBMS 都可以轻松地将其导入空数据库。许多其他网站也有转储,尤其是类似 wiki 的网站(如这两个示例)。

答案2

只需使用随机数据编写大量适当的插入脚本即可。

我无法更具体说明,因为您没有告诉我们有关数据库的任何信息。

答案3

您可以使用一些像这样的“Faker”API: http://faker.rubyforge.org/

或者如果您想要真实数据,您可以从互联网上收集它,几个月前我需要真实数据进行测试,我制作了一个 IRC 机器人,它记录了 Freenode 上前 10 个频道上的所有消息并让它连续数周 24 小时不间断运行,这给了我大量数据(约 100 万行):)

相关内容