- 2 节点 Win 2008 R2 仲裁群集
- 配置192.168.0.0/24“公网”
- 配置集群 MSDTC
- 已安装 SQL 2008 R2 集群实例
- 手动故障转移组 - 确定
- 重新启动服务器(无故障转移组)-故障转移正常
- 从一个节点拔出公共网络电缆-故障转移正常
- 添加了交叉电缆 10.2.0.0/24“专用网络”
- 已验证专用网络上的 ping 状态
- 已验证的文件共享浏览在专用网络上到 C$ 管理共享
- 从一个节点拔出公共网络电缆 - MSDTC IP 地址资源在原始主机上发生故障,而不是故障转移
- 手动将 MSDTC 组移至其他节点 - 一切正常在线
- 在节点 1 上重新安装公共网络电缆,并在节点 2 上在线验证所有内容
- 从节点 2 拔出公网电缆 - MSDTC 和 SQL IP 地址资源在原始主机上发生故障,而不是故障转移
- 在节点 2 上重新安装公共网络电缆并手动来回切换所有资源 - OK
- 重新启动服务器(无故障转移组)-故障转移正常
- 删除交叉电缆专用网络并禁用专用网络 NIC(仅保留单个公共网络)
- 从一个节点拉出公共网络电缆 - 包括 MSDTC 在内的所有内容均正常故障转移
事后有几个人告诉我不要做电缆拉力测试 - 有人有文件说明原因和潜在影响吗?只是说 MVP 这么说,没有文件的话经理是不会接受的。
更重要的是,为什么添加交叉电缆会产生这种影响?
答案1
两个集群节点之间的私有互连具有双重目的:验证节点是否能够看到彼此并验证每个节点有可用的私人连接。
MS 集群服务要求这两项检查都通过,否则它将宣布该节点不可靠,并拒绝故障转移,理由(非常正确)是不是在未知情况下改变任何事情都比在未知情况下进行故障转移(可能是故障节点)要好。
如果私有 NIC 发生故障,该节点将自动认定自己不适合进行故障转移,并有效退出集群。
如果专用连接的两端都插入交换机,这些测试将变得彼此独立,并且每个节点都可以安全地断开其专用连接,而无需其他节点也发生故障。
故事的寓意是:交叉电缆不好,最好留给业余爱好者使用。
答案2
如果它是集群节点之间的直接交叉电缆,那么 IP 地址资源当然会失败 - 从一个节点拉出连接也会导致另一个节点看到 NIC 进入“拔出”状态 - 因此它如何在另一个节点上启动 IP 资源?