何时在虚拟环境中使用服务器故障转移

何时在虚拟环境中使用服务器故障转移

这个问题这让我开始思考 DHCP 中的容错问题,因此我仔细研究了一下当前的环境,发现我们公司每个主要站点只有 1 个 DHCP 服务器,没有冗余。我们所有的 DHCP 服务器都是虚拟的,具有 VMWare 高可用性,并使用 Quantum VMPro 进行定期备份,因此即使我们的 DHCP 服务器发生几乎任何灾难性崩溃,我们仍然可以在一小时内恢复。

这让我认为,用于故障转移的冗余 DHCP 服务器是多余的。但我之前的大部分经验是在小型企业领域,这种情况从未发生过。大企业则截然不同。

我们的大多数文件服务器都采用相同的配置,除了少数尚未纳入虚拟化工作的物理服务器集群之外。

那么在虚拟环境中,添加服务器冗余的决策点是什么?示例:我什么时候添加虚拟 DHCP 备用服务器?或者为文件服务器创建虚拟故障转移群集?我知道如果不列举组织的具体需求,这个问题可能很难回答,但我认为可以描述一些示例情况,以帮助 SA 做好准备有需要了。

我严格关注容错和故障转移 - 在这种情况下,负载平衡完全不相关。

答案1

就像生活中一样,尤其是在 IT 领域,答案是“这取决于”

针对这种非常具体的用例,在虚拟化环境中,VMware HA -那么它实际上并不需要待机-,但 DHCP 仍然是一个非常“轻量”的服务,我的建议是在另一个虚拟机(或甚至另一个现存的如果您使用的是 2012+,请将每个虚拟机 (VM) 都配置为 DHCP 故障转移配置,或者将它们配置为“拆分范围”配置。

參閱了解并部署 DHCP 故障转移在 TechNet 上

对于其他示例(例如 FileServer Cluster 等),您需要评估以下一些内容:

  • 服务有多重要
  • 如果服务中断,会给企业带来什么损失
  • 保持服务冗余需要 IT 花费多少
  • 部署冗余有多容易
  • 保持冗余需要哪些维护成本(人力)
  • 您的其他冗余措施(例如 VMware HA)是否已经“足够好”

答案2

您在这里要问的问题是:重新启动并运行 DHCP 的时间限制是多长?

如果当前设置需要花费太长时间,则应设置故障转移群集。

但是:你真的不信任 vmware 吗?

您想要涵盖什么场景?

答案3

决定是否/何时进行故障转移或服务器冗余取决于几个因素:资源、目标服务类型、备份类型、正常运行时间/停机时间/恢复时间目标。

最简单的情况是,如果您有支持即时恢复的备份。这可以涵盖大多数一般使用情况。您可以在 2 分钟内恢复,并拥有自上次备份以来更新的可用数据。

对于一些具体的,有多种方法。例如:

  • 对于具有数据库并且连续传输大量数据的 ERP 系统,最好有一个故障转移群集(确保您也对存储进行故障转移)。

  • 对于域控制器和权威 DNS 服务器,您始终可以使用主服务器和辅助甚至第三服务器。Windows DHPC 适合这种情况。

  • 对于电子邮件服务器之类的东西,它取决于其他细节,但备用副本通常是一个好主意。

相关内容