我正在致力于增强一个 BI 平台,插入从虚拟数据中心收集的一堆统计数据(基于 Jasper,但这实际上不会产生任何影响)。
到目前为止,我有 4 个虚拟机管理程序和几 TB 的存储空间,因此我可以启动最多 100 个(或多或少)强大的虚拟机。
我想要做的基本上是模拟一个异构 DC,其中包含不同的 Linux 和 Windows 服务器,它们每天都在忙于日常工作,包括周一早上的影响和偶然的高峰,当然还有空闲时间。所有这些,都是为了在 BI 服务器中收集足够的伪实时数据,这样我就可以开始研究缺少哪些数据、开发哪些报告有意义等等。
我想收集一些关于如何模拟真实工作的 DC 的意见,从我需要哪些服务,到如何正确地对它们施加压力,以及对这些压力测试的期望(这样我以后可以在统计数据中验证它)
到目前为止,我有一个电子邮件服务器、目录(AD 和 IPA)、DHCP、监控(nagios)。我需要几个 DB 服务器(可能是 postgres 和 MSSQL),也许还有十几个不同类型的 VDI 桌面……
您向我提出的任何想法都将非常有用,无论是就该演示实验室中服务器的意义而言,还是就如何以可衡量的方式对它们施加压力而言。
答案1
您可以通过获取生产数据库并进行备份来模拟 SQL 负载,然后记录一天中的所有查询。在模拟数据中心中,恢复数据库并重播这些查询是模拟真实 SQL 服务器负载的适当时间。
答案2
您可能需要一些 Web 服务器(apache/IIS/nginx)、ftp 客户端/服务器(ftp、lftp、vsftpd、proftpd)、ssh 客户端/服务器(ssh、scp、openssh)、配置错误的(开放)代理服务器(squid、apache、tinyproxy)、db 服务器(mysql、postgres、mssql)、电子邮件服务器(sendmail、postfix 等 - 显然会发送大量垃圾邮件)、torrent 客户端(rtorrent、utorrent)、dns 服务器(bind)、安全工具(nmap)和一些滥用者来模拟真实的 DC ;-)