为什么大型 Exchange 安装需要停机进行维护?

为什么大型 Exchange 安装需要停机进行维护?

多年来,我使用过几家顶级第三方 Exchange 提供商,所有这些提供商都定期安排停机时间进行例行维护(大约每月一次)。我想知道 Exchange 的哪些方面使得这种停机时间无法避免?是否真的无法保持 24x7 正常运行时间,还是只是成本过高?为什么?

答案1

Windows 和 Exchange 更新始终需要重新启动才能完成安装,所以这是其中的一部分。通过良好的规划和适当的设置(负载平衡器和集群),您可以保持 24x7 的正常运行时间,以便电子邮件始终在一台服务器上可用。

不过,在客户端,总是会出现短暂的中断(5-30 秒),因为 Outlook 会发现它所连接的 CAS 服务器处于离线状态,而自动发现会将其切换到另一个服务器。通常,当这种情况发生时,您会收到“Exchange 管理员进行了更改,需要您重新启动 Outlook”消息。

虽然这不是长时间的停机,但算停机,所以你需要安排维护时间。维护期间也有可能出现问题,所以你需要安排维护时间。

编辑:因此我发现,如果你在 CAS 服务器前面放置一个负载平衡器,你就不会在 Outlook 中收到“Exchange 管理员已进行更改...”消息。当负载平衡器将你切换到活动的 CAS 服务器时,你仍然会遇到短暂的中断。

答案2

长话短说...您使用的提供商并不那么好。

您没有理由需要安排 Exchange 环境的定期停机时间(尽管安排定期维护窗口始终是明智之举)。尤其是对于 Exchange 2010。只要您的冗余计划正确并得到正确实施,一切就会顺利进行。冗余网络、冗余存储、冗余服务器。

您可能无法使用每月收费 3 美元的提供商来实现这一点。我不会转售每月收费 3 美元的 Exchange 邮箱。我推荐托管 Exchange 的大部分原因都与电子邮件和正常运行时间的重要性有关。您必须为不会一直处于宕机状态的提供商支付更多费用,但投资回报率使它变得有意义。

我们的提供商每次进行定期维护时都会发送电子邮件。我们每个月至少会收到一封。99% 的电子邮件基本上都是这样的:“我们将在凌晨 2 点到 2:15 之间对我们的服务器进行维护。在邮箱/存储故障转移期间,您可能会注意到 15-30 秒内出现连接问题。”

如果您希望实现 100% 正常运行时间,而不需要 30 秒的故障转移,那么您在任何地方都找不到。Exchange 不行,Google Apps 不行,Domino 也不行。100% 正常运行时间根本不存在。维护窗口始终是需要的,故障转移仍然需要时间(即使时间很短)。

因此,寻找一个新的提供商可能会花费更多,但可以为您提供所需的正常运行时间。

答案3

为网络的每个部分保留 N+1 冗余,以确保不会因维护而停机,否则成本会更高;如果停机时间过长,服务将不再具有价格竞争力。大多数企业对最短的计划停机时间非常宽容。这并非 Exchange 独有,我接触过的几乎所有托管供应商(无论何种类型)都做着同样的事情。

对于 Exchange 来说,它至少每月会停机一次,以进行星期二补丁。

答案4

Exchange 本身并没有什么不可靠或容易出现故障的地方……事实上,我认为情况恰恰相反。这取决于提供商如何设置以提供其 Exchange服务

A服务可以由一个或多个服务器- 主要网站、电子邮件系统(例如 gmail、hotmail 等)由服务器组提供,旨在允许某些托管服务的服务器离线,而不会影响服务的可用性。

如果提供服务的服务器建立在支持高可用性(例如,集群)的系统上,那么某些提供服务的服务器可能会离线,而实际上服务本身并没有离线。

这就是理论……理论在实践中发挥作用。问题是提供商准备在硬件、系统设计和支持上花费多少钱(例如,从 99.99% 可用性到 99.999% 可用性的成本远高于从 99% 到 99.9% 可用性的成本)。对于托管服务,这很快就会变成一个问题,即人们准备为该服务支付多少钱。

对于提供商来说,这很快就会变得非常昂贵,而且当你追求非常高的可用性时,即使极少量的停机时间都会影响你的统计数据

相关内容