Windows 2003 终端服务器重新启动后无响应

Windows 2003 终端服务器重新启动后无响应

我们有 5 台 Windows 2003 R2 SP2 Std x64 终端服务器,设置为每晚在 45 分钟内重新启动。通常,其中至少有一台在重新启动后不会响应 RDP 请求。如果我连接到控制台,我可以正常登录。Netstat 显示 TS 正在监听 3389 等。我能够让它们再次响应的唯一方法是手动重新启动。

所有终端服务器在重启后都会在事件日志中显示以下错误(但并非所有服务器都没有响应,大多数在重启后都能正常工作)

Event ID 5719 - Error - Netlogon - This computer was not able to set up a secure session with a domain controller in domain DOMAIN due to the following: There are no logon servers available.

Event ID 4321 - Error - NetBT - The name DOMAIN :1d" could not be registered on the interface with IP address [IP address]. The machine with the IP [IP address of domain controller] did not allow the name to be claimed by this machine.

但是,这些事件也会出现在成功重启的机器上。有人能帮我解决这个问题吗?就像我说的,这种情况并不是每次都会发生,也不是在每台服务器上都会发生。只有有时一两台服务器才会发生。非常令人沮丧。

谢谢您的帮助!

答案1

听起来像是受影响服务器上的 TS 服务出了问题。它们可能挂起了,或者在等待 DC 的响应,而 DC 在网络上丢失或乱码了,或者在操作系统启动时无法正确启动,等等。

  1. 我要做的第一件事是将 TS 服务设置为延迟启动,以防出现操作系统或机器启动问题。它会将服务设置为在大多数其他服务之后启动,因此任何依赖项都应该完全启动,并且不会与它同时启动其他服务发生任何冲突。
  2. 如果失败,我会使用计划任务在操作系统启动几分钟后重新启动服务。(根据重启时间、机器启动速度和操作系统加载速度,需要进行一些猜测才能正确安排。)
  3. 检查机器上的 NIC?原因可能是过时的驱动程序或固件以及更新的软件(如 Windows 更新和您 [希望] 应用的任何其他补丁)不时相互冲突吗?
  4. 如果失败了(也许无论如何,为了尝试解决根本原因,而不仅仅是缓解症状),我会在受影响的服务器上重新安装(卸载,重新安装)终端服务。我遇到过这种问题,没有 EventID 4321,这通常可以解决问题,至少当它是服务器上的 TS 服务的问题,而不是由网络或域控制器问题引起时。
  5. (也许在 #4 之前做这个)从域控制器排除此故障。有一个原因事件日志告诉您服务器无法联系登录服务器,并且域控制器不允许将主机名分配给指示的接口。这可能是由域或域控制器设置引起的。查看 DC 以查看是否有任何迹象。(不要忘记查找 GPO 设置、启动脚本等。)
  6. (也许在 #4 之前也这么做)从网络角度排除故障。网络是否可能偶尔会破坏这些服务器和 DC 之间的流量,从而导致您在服务器事件日志中看到的身份验证和名称分配问题。
  7. (也许在做任何事情之前都这样做) 尝试说服你的老板(或任何人)您可能认为,这是“控制”夜间重启所导致的,并且/或者,这是在进行夜间服务器重启这种愚蠢做法时的“预期行为”。或者,如果您修复了它,除非重启停止或频率降低,否则修复将停止工作。在启动的额外压力导致硬件故障后,您将获得额外的好处,即几年后不必更换服务器。 :/

答案2

我在我们的 Windows 2003 SP2 TS 服务器中看到了这些错误。出于旧版应用程序兼容性原因,它每晚都会重新启动(就像您的一样)。

我认为您已经检查过这一点,但是过去我遇到过一些硬盘空间问题,导致我们遇到类似的情况。

顺便说一句,任何 TS 服务器都是 DC。不是吗?

答案3

看起来您没有使用静态 IP 地址,但这可能是一个映像问题。如果您还没有设置静态 IP 地址,我强烈建议您设置它。每个终端服务器都应该有自己的静态 IP 地址,并手动配置为指向正确的域控制器。

事件 ID 4321 - 错误 - NetBT 此特定错误可能有多种原因。我感觉您的终端服务器已进行过映像处理。在对它们进行映像处理后,很可能不会重新制作虚拟网络适配器;因此,所有服务器的 NIC 信息完全相同。如果对它们进行过映像处理,并且情况确实如此,我建议复制虚拟适配器的信息(拍张照片或做点其他事情... IP 地址信息、DNS 和 Wins 信息、DNS 后缀等),然后重新创建虚拟适配器。所有终端服务器可能都在尝试通信,但网络会变得混乱...因为 3 台服务器具有相同的 NIC 信息。另外,请务必检查所有信息。确保您的子网掩码正确(可能是 255.255.255.0)。

我遇到过类似的情况,我似乎可以直接使用计算机,但无法远程访问。我发现由于对机器进行映像处理,我的虚拟适配器需要重新制作。希望这能有所帮助!

答案4

我发现很多来自微软的知识库文章都提到了 NIC 问题,正如你所说,所有服务器都出现了相同的错误。我认为问题出在你的交换机上。如果你有托管交换机,你必须禁用生成树或启用快速启动(对于思科)。

以下是在 Cisco Catalyst 交换机中执行此操作的命令:

config terminal
interface Gi1/0/19
spanning-tree portfast

注意关闭使用以下命令:

no spanning-tree portfast

以供参考 思科

相关内容