我们有一个新的多宿主 Windows Server 2008(64 位)集群,它表现出一些奇怪的行为。
问题:
一切运行正常,直到我们对其中一个集群组进行故障转移
在故障转移之前,内部客户端可以像外部客户端一样进行连接。并且所有域身份验证均能正常工作。
一旦我们对集群组进行故障转移,不同子网中的内部客户端就会失去连接(好像静态路由消失了),并且您将无法再使用域帐户登录服务器(域控制器位于不同的子网中)
所有 DNS 查找都通过公共/Internet 接口进行。就好像服务器无法再找到/解析内部/域 DNS 服务器一样。
重新启动可解决问题,直到下一次组故障转移
将默认网关设置为内部网络也是可行的,但极端的后果是必须为整个互联网设置静态路由(我没有时间)
网络适配器如下:
心跳网络(两台服务器之间的交叉电缆)
内部网络(基于 Active Directory 的网络,带 DNS,无 WINS)
公共网络(互联网连接 -默认网关- 带 DNS)
Microsoft 群集故障转移虚拟适配器(在大多数情况下是隐藏的,但执行“ipconfig /all”时可以看到它)
其他信息:
该系统必须为内部和公共网络提供服务
公共/互联网连接是默认网关
我们已经输入了到内部网络的几个子网的永久静态路由
每个群集组都有一个网络名称和关联的 IP 地址
网络接口的绑定顺序为:
1 内部
2 公共
3 心跳
我们被难住了。我们在较旧的 Windows 2K 集群上使用过此配置。我们还在独立的 Windows 2K3 服务器上使用过此配置。任何建议都将不胜感激。
托德
答案1
我认为我在新的 2008 R2 集群上遇到了同样的问题,该如何解决?我有一个微软案例,他们向我指出了弱/强主机,但这没有帮助。
以下是针对 Broadcom NIC(可能还有其他)的所有问题的解决方案:
http://support.microsoft.com/default.aspx?scid=kb;EN-US;951037
您必须禁用 rss/chimney/netdma。在戴尔/微软支持人员致电后,我的问题立即得到解决!
答案2
下列邮政微软高级支持升级工程师 John Marlin 在 technet 上描述的正是当时正在发生的事情并提供了解决方案。
他将这个问题描述为:
“问题是,当您向 Windows Server 2008 故障转移群集上的网络适配器添加静态持久路由并使群集 IP 地址脱机(或将其移动到另一个节点)时,“活动”路由将被删除,并且无法使用此路由建立连接,即使它仍显示为持久路由。一旦您将群集 IP 地址重新联机,活动路由就会返回。”
我们听从了他的建议,一切开始好转!我们确实遇到了一些额外的 DNS 问题,但这些问题更容易解决。从网络角度来看,Windows Server 2008 在集群化时确实与以前的版本截然不同。
笔记:我们还遇到了很多应用程序绑定到虚拟集群故障转移适配器/地址的问题,以及多播/udp 流量和 Windows 防火墙的其他问题,但那是另一篇文章的内容了。