基本上,我们目前正在测试新的 2012 林/域并设置 3 个 2012 DC。一切运行良好,我们即将开始准备进入生产状态。幸运的是,发生了一次停电,之后一个 DC 崩溃,Windows 无法启动,过去几天我们尝试了各种方法让它工作,但没有成功。无论如何,这不是重点,只是一些背景信息。
崩溃的服务器是我们的“主”DC,或者说是我们首先设置并安装林/域的 DC。其他两个已加入。
我们以为有了两个备份 DC,即使其中一个崩溃也不会有什么问题,但显然这是一个大问题。另外两个 DC 现在无法连接到林/域,无法复制,无法执行任何操作。这些 DC 是否只是一直从我们的主 DC 获取数据并基本上充当负载平衡器?
重新做所有事情并不是什么大问题(虽然很烦人),而且由于我们还没有达到生产状态,所以我们没有备份。虽然数据在磁盘上仍然是安全的,但由于 winlogon.exe/csrss.exe 问题,Windows 无法启动。
所以基本上我的问题是:如果我们的“主要”DC 发生故障,为什么所有 DC 都会发生故障?
答案1
崩溃的服务器是我们的“主要”DC,
不存在,自 2003 年以来就没有了。
我们认为,有了两个备用 DC,即使其中一个崩溃也不会有问题,但显然这是一个大问题。
好的,让我猜一下。您先在那台机器上安装了 AD,然后又在另一台机器上安装了 AD,而没有人费心将所有其他 DC 设置为 GC(全局目录)?还是您太懒了,只在客户端中使用一台计算机作为 DNS,所以他们现在看不到域控制器?
为什么当我们的“主要” DC 发生故障时,所有 DC 也会发生故障?
事实并非如此。有 5 个“角色”只拥有一台机器,并且它们 (a) 都不会立即失效,并且 (b) 可以随意移动/占用。也就是说,如果负责生成对象 ID 的机器消失了,那么一段时间后您可能无法创建新对象,但每台机器获得的不是一个数字,而是一个可以使用的池(因此问题不是立即出现的),您可以将其移动到另一台机器。
有一个“PDC 模拟器”用于时间同步和模拟旧的 pre-kerberos/AD 风格的 PDC 之类的东西,但这只是一个模拟器,可以使用该角色。
不过,域控制器有两种类型 - 常规和全局目录。只有后者才拥有所有数据。您可以将一台机器设为 GC(然后将其删除)- 它只是一个小标记。但它不是默认设置的。
因此,如果您没有安装 AD,也没有安装另外 2 个控制器,那么您仍然只能使用 GC - 然后您就可以开始了。您至少有可能失去了安全性。
然后是 DNS 问题 - 您是否正确配置客户端计算机(和服务器)以使用多个 AD 实例作为 DNS?
顺便说一句,这可以追溯到 Windows Server 2003。
我建议在另一个域控制器上运行诊断。