我有两个 mssql 2005 实例,正在使用 CA XOSoft 复制。主服务器是故障转移群集,副本服务器是独立服务器。它们都运行 Server 2003 sp2 x64。所有服务器上的补丁级别相同。这个设置已经运行了几个月,直到我们最近限制了主服务器两个节点上的 RPC 端口(使用 rpccfg.exe 限制为 5000 - 6000)。我们必须实施出口过滤,从而限制端口。
我们开始收到 SQL Windows 身份验证和 NETLOGON 事件 ID:5719 的登录错误:
此计算机无法与域中的域控制器建立安全会话,原因如下:存储空间不足,无法处理此命令。这可能会导致身份验证问题。请确保此计算机已连接到网络。如果问题仍然存在,请联系您的域管理员。
我们还发现组策略无法更新,集群文件共享也同时脱机。当我们开始看到这些问题时,RPC 端口被重新设置为默认值,服务器重新启动,但问题仍然存在。域控制器没有显示任何错误。运行 dcdiag 和 netdiag 显示一切正常。
我们注意到 XOSoft 服务 ws_rep.exe 正在使用大量句柄(8 - 9k),与 sqlserver 使用的数量大致相同。
一旦停止 xosoft 复制,登录错误就会消失,一切都会正常运行。我已经向 CA 开具了 XOSoft 的票据,但我不确定问题是否真的出在 xosoft 身上,但它是导致问题暴露的原因。
我正在寻找有关调试 RPC 问题的提示。特别是有关限制端口然后恢复更改的提示。
答案1
检查非分页池内存。应用程序运行时,内存可能已耗尽。
至于您的问题,我发现 rpcping 在这些情况下是一种非常有用的工具。以下是它在 Exchange 中的使用示例: