VCenter 应该是虚拟机吗?/它可以是外部硬件吗?

VCenter 应该是虚拟机吗?/它可以是外部硬件吗?

我们有 6 台 ESX 服务器运行 +150 台虚拟机。目前我们的 VCenter 服务器就是其中一台虚拟机。前几天,我们的 DC 发生了硬件故障(由一台不可靠的 UPS 引起),导致两台服务器瘫痪。第一台瘫痪的服务器运行的是主 VCenter 服务器,第二台运行的是 HA/Heartbeat VCenter 服务器,因此我们的主机都没有从两台故障主机迁移到 4 台正常运行的主机上,我们失去了大部分虚拟机管理(所有用户都使用 VSphere)。这是一个非常不幸的情况,希望这种情况不要经常发生,但我想知道,在另一个数据中心*/专用于 VCenter 的冗余块中的单独机器上运行主 VCenter 服务器,将备份作为虚拟机,这是否是个好主意?这有可能吗?(我们只有虚拟设备,但如果有的话,我认为追踪它并不难)。

*说来惭愧,我们所有的 VMWare 服务器都在一个 DC 中运行。我们将 SAN 镜像到第二个 DC,但那里没有服务器。它们只是开发/非关键服务器,但如果它们宕机,人们还是会大喊大叫。

答案1

没有理由不这样做。我不知道 VMware 是否明确指示您在物理或虚拟硬件上运行 vCenter,我相信两者都支持它。

根据您要预防的故障类型,最好尽可能将冗余/备用实例与主/实时实例分开。 单独的网络、出租车、电源甚至建筑物、城市和国家都是好主意 - 它们的成本不同,并且有自己独特的挑战。

在这个特定案例中,听起来你遇到了一次你没有设计/考虑到的中断,或者故意选择不设计。将管理服务器与 ESXi 主机放在同一个基础架构上,使用相同的电源、网络等,都存在着同样的风险,即单一事件会毁掉一切。

你可以选择 - 要么选择不做任何改变,忍受这种特定类型的事件再次发生而导致的中断,要么选择不做改变,花一些钱来缓解影响。这两种方法都有效,完全取决于中断的成本与改变的成本。

答案2

我不认为裸机安装或虚拟化安装有什么区别。我所看到的当前高可用性设置的唯一限制是节点之间的延迟小于 10ms。对我们来说,这将我们限制在一个数据中心 - 我没有任何其他足够接近 10ms 访问的数据中心。

这是vCenter 6.5 高可用性最佳实践指南

由于您可能被困在单个数据中心,其中有 3 个 vCenter 实例用于 HA 配置,因此您需要尽可能消除每个实例之间的其他共性。单独的服务器、单独的机架、房间或建筑物的不同部分、不同的存储等。您可以将每个节点彼此分开得越多,某个地方的单一故障不会导致所有节点瘫痪的可能性就越大。

相关内容