长时间停机后将 Windows 故障转移群集角色重新联机时出现访问被拒绝错误

长时间停机后将 Windows 故障转移群集角色重新联机时出现访问被拒绝错误

我有一个双节点故障转移群集,使用可用性组(DB1 和 DB2)运行 SQL Server 2016(标准版)。我关闭了 DB2,作为 COVID 的一项成本节省措施,方法是将所有角色切换到 DB1,从 DB1 上的可用性组中删除所有数据库,然后关闭 DB2。

三年后,我让 DB2 重新上线,但这似乎导致 DB1 出现故障。我设法通过将其逐出并重新添加使其重新上线,但仍有一些角色无法正常工作,我无法使其重新上线。每个角色的 IP 地址都在线,但网络名称资源处于故障状态。

如果我尝试将其联机或尝试使用修复功能来修复它,我会收到错误消息“用户名或密码不正确”。群集事件显示一条错误消息,指出无法找到可写域控制器,原因是“用户名或密码不正确”。

我确实找到了一篇关于需要应用修补程序的文章,但那是针对 Windows Server 2012 的,而这是 Windows Server 2016。其他文章说尝试刷新 DNS,但没有用。

我需要设置另一个可用性组,但该组也无法上线,并出现有关查找可写域控制器的相同错误消息,并且无法在活动目录中创建计算机或无法在 DNS 中创建域名。

如果我连接到 DB1 并启动故障转移群集管理器,它就不会连接到故障转移群集,并且在我尝试时收到错误消息“访问被拒绝”。

这些不是域控制器,我使用域管理员帐户登录到服务器。

答案1

DB2 有可能在离线期间失去了与域的信任关系,这种情况在所有情况下可能不会立即显现出来(特别是当您使用以前用于登录机器的帐户登录时(因为如果它无法联系域控制器来验证凭据,它将退回到其本地缓存))。

这可能解释了您所看到的无法写入/更改 DNS 条目等资源的症状。

我建议验证 DB2 是否仍然与域具有信任关系 - 说实话,考虑到您所概述的情况,这里最直接的操作可能就是从域中删除 DB2 并再次执行域加入过程。

完成后,您可以重试将其重新添加到集群关系中。

相关内容