这个问题这让我开始思考 DHCP 中的容错问题,因此我仔细研究了一下当前的环境,发现我们公司每个主要站点只有 1 个 DHCP 服务器,没有冗余。我们所有的 DHCP 服务器都是虚拟的,具有 VMWare 高可用性,并使用 Quantum VMPro 进行定期备份,因此即使我们的 DHCP 服务器发生几乎任何灾难性崩溃,我们仍然可以在一小时内恢复。
这让我认为,用于故障转移的冗余 DHCP 服务器是多余的。但我之前的大部分经验是在小型企业领域,这种情况从未发生过。大企业则截然不同。
我们的大多数文件服务器都采用相同的配置,除了少数尚未纳入虚拟化工作的物理服务器集群之外。
那么在虚拟环境中,添加服务器冗余的决策点是什么?示例:我什么时候添加虚拟 DHCP 备用服务器?或者为文件服务器创建虚拟故障转移群集?我知道如果不列举组织的具体需求,这个问题可能很难回答,但我认为可以描述一些示例情况,以帮助 SA 做好准备前有需要了。
我严格关注容错和故障转移 - 在这种情况下,负载平衡完全不相关。
答案1
就像生活中一样,尤其是在 IT 领域,答案是“这取决于”。
针对这种非常具体的用例,在虚拟化环境中,VMware HA -那么它实际上并不需要待机-,但 DHCP 仍然是一个非常“轻量”的服务,我的建议是在另一个虚拟机(或甚至另一个现存的如果您使用的是 2012+,请将每个虚拟机 (VM) 都配置为 DHCP 故障转移配置,或者将它们配置为“拆分范围”配置。
參閱了解并部署 DHCP 故障转移在 TechNet 上
对于其他示例(例如 FileServer Cluster 等),您需要评估以下一些内容:
- 服务有多重要
- 如果服务中断,会给企业带来什么损失
- 保持服务冗余需要 IT 花费多少
- 部署冗余有多容易
- 保持冗余需要哪些维护成本(人力)
- 您的其他冗余措施(例如 VMware HA)是否已经“足够好”
答案2
您在这里要问的问题是:重新启动并运行 DHCP 的时间限制是多长?
如果当前设置需要花费太长时间,则应设置故障转移群集。
但是:你真的不信任 vmware 吗?
您想要涵盖什么场景?
答案3
决定是否/何时进行故障转移或服务器冗余取决于几个因素:资源、目标服务类型、备份类型、正常运行时间/停机时间/恢复时间目标。
最简单的情况是,如果您有支持即时恢复的备份。这可以涵盖大多数一般使用情况。您可以在 2 分钟内恢复,并拥有自上次备份以来更新的可用数据。
对于一些具体的,有多种方法。例如:
对于具有数据库并且连续传输大量数据的 ERP 系统,最好有一个故障转移群集(确保您也对存储进行故障转移)。
对于域控制器和权威 DNS 服务器,您始终可以使用主服务器和辅助甚至第三服务器。Windows DHPC 适合这种情况。
对于电子邮件服务器之类的东西,它取决于其他细节,但备用副本通常是一个好主意。