我目前有 10 台 IBM x3650 M4 服务器。每台服务器至少包含: - 双 Xeon - 192GB - 384GB - 2TB SSD RAID 10(8 x 500GB 驱动器) - 4NIC
所有硬件都是冗余的,PSU、CPU、RAM 等。每个 PSU 都插入单独的 PDU。NIC 配置为 2 个组。一个用于主,一个用于备份/故障转移。每个组都在不同的物理交换机上。我有冗余路由器。
我还运行一台备份机 x3630,它有一个 27TB RAID5 用于备份。我使用 Altaro 备份进行每周备份,并且每天触发一个 php / powershell 来备份 sql 数据库,然后复制到备份机。一些重要站点使用复制,现阶段只有 4 台虚拟机。这些复制到备份服务器。
每台机器都为 Hyper-V 设置,并托管大约 20 个虚拟 Windows 盒。我已经相当成功地消除了任何单点故障。如果一台机器死机了。我们会打开复制的机器,并从备份中恢复到备用主机上——我们手头上总是有备用主机。我对池化资源或更好的硬件使用方式很好奇。我想确保如果主机死机了。服务继续运行。我需要晚上睡得更安稳。
我读了一些关于卷共享/集群、SCVMM 的资料,甚至参加了 MS 的课程(课程主讲人大部分时间都在解决怪癖和错误)我读过很多博客,其中 SCVMM 的管理引发了足够多的问题,使其变得毫无用处。机器目前是工作组的。2003/2008 年曾运行 AD,但一直在修复 DNS 问题,用户经常因 x 或 y 原因无法登录。工作组虽然提供的安全性较低,但通过具体直接的设置和故障排除提供了更高的可靠性。
关于如何改进我的流程和做事方式,您有什么建议吗?我喜欢资源池的想法。其他人是如何配置此类网络的。我需要一些额外的硬件吗 - 例如 10GBE 或光纤?我以前在运行传统硬盘时遇到很多 IO 问题。转换为 SSD 解决了这个问题。
提前致谢。
答案1
所以您的所有虚拟机都在每个主机的本地存储上运行,并且当主机发生故障时,您会使用 Hyper-V 副本将这些虚拟机“故障转移”到其他主机?如果是这样,那么有更好的方法可以做到这一点。在所有主机之间创建故障转移群集,在所有主机之间实现群集共享卷,将虚拟机存储移动到 CSV,并将虚拟机配置为群集中的高可用性角色。然后,当发生主机故障时,故障主机上的虚拟机将在剩余主机上实例化。