我试图确保在我们的实验室管理环境中恢复过程尽可能可靠。我们经常(每天)将 10-12 个服务器工作区恢复到以前的版本,对其进行升级,然后对其进行测试。每隔几周,我在恢复后就会遇到一个新问题,一两个团队必须等待我进行操作。
这些服务器是运行各种应用程序的 Win2K3 服务器。它们是工作区外部的域成员。
问题:为了实现 100% 可靠的恢复,您需要做什么?除了以下这些,还有什么惊喜等着我?这些问题有更好的解决方案吗?
注意:遗憾的是,在这种情况下,封闭的工作区并不实用。这些是无围栏环境。将工作区保存到配置并克隆对于日常使用来说往往太慢了 - 即使我们已将磁盘做得尽可能小(每台机器 10GB)。
遇到的障碍:
机器每 x 周更改一次密码 (?) 或 DC 的其他凭据。快照无法连接到域。通过以下方式防止
[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Netlogon\Parameters] “DisablePasswordChange”=dword:00000001
计算机从快照恢复时时间不正确,机器之间的时间不同步。混乱随之而来。最终解决方案:确保主机正在运行 NTP 客户端 - 我们的一个没有运行,确保客户端与主机同步。根据 VMWare,这是我们许多问题的根源。
总结好答案
- 断电状态下拍摄快照. 预防多种问题,包括NTP。
答案1
我建议你拍快照当虚拟机关闭时。
尽管 vmware 允许您对实时服务器进行快照,但如果您不对内存进行快照,那么就像发生了电源故障一样 - 如果您对内存进行快照,那么您将遇到诸如 NTP 无法立即运行等问题。
VMware 快照的优点在于恢复速度非常快。它们并不是像传统意义上那样制作“服务器快照”,而是创建一个新文件,其中包含拍摄快照后对磁盘所做的任何更改。因此,恢复意味着丢弃“增量”文件。(缺点是,如果您想长时间保留快照,增量文件会继续增长)
答案2
如果您将 VM 时间同步到主机并将主机同步到 DC,那么可能就不是问题了。
您可以设置 vmware tools 在 resume & co 之后执行脚本。创建脚本进行清理:ipconfig /flushdns ipconfig /renew net stop w32time && net start w32time
您可以使用清单从资源工具包中删除/删除 Kerberos 票证,然后针对您的 DC 获取新的票证
答案3
如果可能的话,我建议在您的配置中运行 DC。按照您喜欢的方式配置所有内容,关闭整个配置,取消部署并将其捕获到库中。如果您在机器运行时捕获它们,当您尝试重新部署它们时,如果您的环境是非同质的(即尝试将在 Intel 处理器上启动的正在运行的机器部署到 AMD 处理器),您可能会遇到错误(或无法重新部署)。
您无需恢复,只需部署整个配置的全新副本,甚至可以部署此配置的多个隔离副本。
当然请记住,配置中的所有机器最终都必须部署到同一物理主机。