Windows Server 2008 重新启动并冻结

Windows Server 2008 重新启动并冻结

我有一台双 Intel 5420(8 核),运行 16GB 内存,2 x 1.5TB 驱动器(软件 RAID 1),运行 Windows Server 2008。

最近我遇到了严重的问题,服务器意外重启,登录屏幕冻结,只剩下一个黑色的冻结屏幕。

该服务器最初安装了 Linux 和 Xen HVM,并有 3 个 vps 单元,其中一个单元有 5 个核心,大部分内存都用于运行 Windows。这还不够,所以我们选择了整个专用服务器,只用于 Windows。由于它运行 3 个 vps 单元没有问题,因此运行 Windows 应该也不会出现任何问题。

它在初始安装后运行了大约一个小时,然后毫无预警地重新启动。我们重新安装并要求 DC 运行硬件测试。他们没有发现任何问题。安装后,它又持续了一个小时。我们选择更换两个硬盘。他们这样做了,我们又重新安装了。这次又过了 2 个小时,它又重新启动了。

所以我们要求换一个型号的 MB,因为我们认为它可能与 Windows 不兼容。还是一样,重启。这是在换了新 MB 和 Proc 之后。

所以我想可能是电源的问题,以前也发生过这种情况。所以 DC 更换了 PSU、PDU 和电缆。这次持续了大约 4 个小时,然后再次重启。

所以我要求换一个全新的设备并重新安装。他们这样做了。

这次它似乎成功了,我最初安装时它撑了 48 小时。然后我们又运行了负载测试软件 48 小时以确保它正常工作。它撑了整整 48 小时,没有出现任何问题。

然后我们将其交给 .net 软件安装程序。它持续了 2 个小时,然后重新启动。我们认为这可能是一个侥幸,所以我们就把它留在那里了。

从 11 月开始,它就一直运行,没有重启过一次。周四,它突然卡在登录屏幕上。我们手动重启了它,然后大约 6 小时后它又卡在了黑屏上。到目前为止,它已经持续了整个周末。

由于这都是新硬件,而且已经使用了这么长时间,所以我很肯定它不再是硬件了。周四,我让 DC 进行了全套硬件测试,耗时 5 小时,包括完整的 RAM 模块测试。

由于在 RDP 会话中运行软件,90% 的时间里它只占用 16GB 内存中的 14GB 左右。

该服务器用于远程 RDP 登录以运行学校软件,该软件有点大,每个开放进程开始时占用 90Mb,然后逐渐增大。我们每所学校和两个地点大约有 30 名教师和工作人员。今天我统计了使用该软件的 30 个登录 RDP 会话。

当然,服务器也运行其 SQL 服务器,以及 IIS、Apache 和 Filezilla ftp。Apache 是一个简单的 php api,仅此而已,而且用户很少。

我并不是一名经验丰富的 Windows 技术人员,但我认为它不再是硬件,而是软件和用户过多而导致的服务器超载。

我从哪里可以进行更多测试?软件 RAID 会导致这种情况吗?如果是,我可以通过关闭它来安全地进行测试吗?

还有可能是什么以及我遗漏了什么?

相关内容