Windows Server 2003 可用性/正常运行时间

Windows Server 2003 可用性/正常运行时间

我正在考虑制定一份支持 SLA。作为基准,我想大致了解非集群 Windows 2003 Server 的可用性百分比。

假设服务器的规格适合运行应用程序(因此不会很费力),并且正常运行时间是指服务器可用。它需要进行合理的常规维护(安全补丁等)。

人们会期待什么?

答案1

在起草 SLA 时,更重要的是与客户达成他们的期望(和可负担得起的内容),而不是在您拥有的设备和预算限制内您愿意支持什么。

例如:对于需要 99.999% 正常运行时间、24 小时随叫随到支持以及在发生重大故障时 1 小时内“恢复运行”的客户,单个非集群服务器并不适合。从技术上讲,接受这一点是不合理的,客户需要理解这一点。

是的,Windows 2003 Server 非常可靠,性能非常好。品牌服务器具有久经考验的可靠性和坚如磐石的保修。定期监控和 TLC 可以让服务器运行多年。

你需要“抱最好的希望,做最坏的打算”。

您还需要准确计算您的可用性统计数据,并与客户达成计算一致(凌晨 2 点的 1 小时停机时间和周二上午 11 点的 1 小时停机时间的“成本”是不同的)。

您需要整合维持服务器正常运行所需的所有附加设备(网络、交换机、防火墙、操作员时间、备份)。

最后,您需要测试您的应急计划,并保持基础设施的灵活性,以便您可以通过几种不同的方式解决故障。

答案2

我们实际上无法给您提供标准数字,服务器 2003 本身是一个非常稳定的系统,但您可以预期的正常运行时间取决于许多可变因素。

理论上,您唯一需要让服务器离线的事情就是应用更新,最多每周一次。您可以通过计算服务器重新启动所需的时间来计算停机时间。

理论上这一切都很好,但我们都知道服务器也会因为其他原因而离线,硬件故障、网络问题、软件挂起,这些都不是你能够轻易预测的事情,但建议及时应对不可预测的事件。

最后,您要考虑计划升级或更改的时间,服务器的使用是否会随着时间的推移而增加,是否需要升级来应对变化?

考虑到所有这些因素,您将得到预计的正常运行时间,如果没有故障、没有升级等,您的实际正常运行时间可能会比这更好,但最好还是谨慎一点。

答案3

根据我使用 Server 2003 Standard R2 的经验,我可以告诉你,如果您没有任何硬件/网络问题,那么这个数字会很高。

我拥有的 2 台运行 Server 2003 的服务器从未自行崩溃过。其中一台服务器的正常运行时间记录为 240 天!!!请注意:这是因为它们从未在系统上安装更新。

要使 2003 无法正常运行,需要付出很大努力。

答案4

无论哪个版本的 Windows 都受益于定期重启。操作系统本身存在内存泄漏,甚至不考虑应用程序和服务。更新也需要重启。您可以轻松地将这两项操作结合起来,每周的停机时间恰好是重启所需的时间。

在尝试了各种方法来应用更新并定期重启后,我了解到最好的方法是编写更新脚本,但不允许更新过程重启机器。我遇到过多起服务器无法正常关闭或由脚本更新触发重启时无法正常重新启动的情况。单独执行重启。我安排在周六晚上 11 点开始安装更新,并在周日凌晨 3 点至 4 点之间在服务器上错开重启。

监控系统在此期间不会发出警报,以防止产生不必要的警报。此外,服务器在重新启动后会向我发送电子邮件。周日早上醒来时,我会查看电子邮件。如果有任何警报或我没有收到来自每个重新启动服务器的电子邮件,我就知道有问题了。不过还没有发生过。

相关内容