故障转移后多宿主群集 Windows Server 2008 网络连接问题

故障转移后多宿主群集 Windows Server 2008 网络连接问题

我们有一个新的多宿主 Windows Server 2008(64 位)集群,它表现出一些奇怪的行为。

问题:

  • 一切运行正常,直到我们对其中一个集群组进行故障转移

  • 在故障转移之前,内部客户端可以像外部客户端一样进行连接。并且所有域身份验证均能正常工作。

  • 一旦我们对集群组进行故障转移,不同子网中的内部客户端就会失去连接(好像静态路由消失了),并且您将无法再使用域帐户登录服务器(域控制器位于不同的子网中)

  • 所有 DNS 查找都通过公共/Internet 接口进行。就好像服务器无法再找到/解析内部/域 DNS 服务器一样。

  • 重新启动可解决问题,直到下一次组故障转移

  • 将默认网关设置为内部网络也是可行的,但极端的后果是必须为整个互联网设置静态路由(我没有时间)

网络适​​配器如下:

  • 心跳网络(两台服务器之间的交叉电缆)

  • 内部网络(基于 Active Directory 的网络,带 DNS,无 WINS)

  • 公共网络(互联网连接 -默认网关- 带 DNS)

  • Microsoft 群集故障转移虚拟适配器(在大多数情况下是隐藏的,但执行“ipconfig /all”时可以看到它)

其他信息:

  • 该系统必须为内部和公共网络提供服务

  • 公共/互联网连接是默认网关

  • 我们已经输入了到内部网络的几个子网的永久静态路由

  • 每个群集组都有一个网络名称和关联的 IP 地址

  • 网络接口的绑定顺序为:

    1 内部

    2 公共

    3 心跳

我们被难住了。我们在较旧的 Windows 2K 集群上使用过此配置。我们还在独立的 Windows 2K3 服务器上使用过此配置。任何建议都将不胜感激。

托德

答案1

我认为我在新的 2008 R2 集群上遇到了同样的问题,该如何解决?我有一个微软案例,他们向我指出了弱/强主机,但这没有帮助。

以下是针对 Broadcom NIC(可能还有其他)的所有问题的解决方案:

http://support.microsoft.com/default.aspx?scid=kb;EN-US;951037

您必须禁用 rss/chimney/netdma。在戴尔/微软支持人员致电后,我的问题立即得到解决!

答案2

下列邮政微软高级支持升级工程师 John Marlin 在 technet 上描述的正是当时正在发生的事情并提供了解决方案。

他将这个问题描述为:

“问题是,当您向 Windows Server 2008 故障转移群集上的网络适配器添加静态持久路由并使群集 IP 地址脱机(或将其移动到另一个节点)时,“活动”路由将被删除,并且无法使用此路由建立连接,即使它仍显示为持久路由。一旦您将群集 IP 地址重新联机,活动路由就会返回。”

我们听从了他的建议,一切开始好转!我们确实遇到了一些额外的 DNS 问题,但这些问题更容易解决。从网络角度来看,Windows Server 2008 在集群化时确实与以前的版本截然不同。

笔记:我们还遇到了很多应用程序绑定到虚拟集群故障转移适配器/地址的问题,以及多播/udp 流量和 Windows 防火墙的其他问题,但那是另一篇文章的内容了。

相关内容