数据库镜像问题

数据库镜像问题

我们在数据库镜像方面遇到了一个奇怪的问题,要发布该问题,我必须先解释一下我们的架构。

我们有两个节点 [节点 1 和节点 2] 集群,上面安装了两个 FCI [SQLPRD01 和 SQLPRDO2],这是一个主动/主动集群,即 SQLPRD01 的首选所有者是节点 1,而 SQLPRD02 的首选所有者是节点 2。从这些集群实例中,我们将数据库镜像到不同数据中心的不同集群,以用于 DR 目的,该集群有两个节点 [节点 3 和节点 4],它们安装了 SQLDR01 和 SQLDR02,节点 3 是 SQLDR01 的首选所有者,节点 4 是 SQLDR02 的首选所有者。因此,数据库镜像分别从 [SQLPRD01 到 SQLDR01] 和 [SQLPRD02 到 SQLDR02] 建立。上周我们在 SQLPRD02 上遇到了一个问题,应用程序超时,镜像将处于断开连接状态,但是当我将 SQLPRD02 从节点 2 故障转移到节点 1 时,镜像恢复,应用程序能够毫无问题地连接。上周是间歇性的,但从昨天开始,问题一直存在,即当我将 SQL 故障转移到其首选节点 [节点 2] 时,镜像将处于断开连接状态,但在节点 1 上工作正常。

到目前为止,我已经解决了以下问题,

1) ODBC/UDL/Telnet 从所有 PRD 到 DR 节点均成功,反之亦然。应用服务器也进行了相同的测试,结果成功。2) 这些是物理机器,所以我们更换了 PRD 集群上的 N/W 电缆。3) 验证了 SQLPRD02 和 SQLDR02 上 SQL 服务帐户(用于镜像设置)的权限,它具有 SA 访问权限并连接到端点访问权限。4) 所有补丁/修补程序/固件更新都处于同一级别,SQL 版本为 2102,在 PRD 和 DR 上处于同一级别。5) 向 MS 提出了一个案例,他们运行了 PSSDiag,到目前为止他们还没有找到确凿的证据。

SQLPRD02 实例上的确切错误消息:

消息数据库镜像连接错误 4‘连接已被远程端关闭,或者接收数据时发生错误:‘64(指定的网络名称不再可用。)’对于‘TCP://SQL 群集/SQLDR02 的网络名称,端口’。

相关内容