如何配置 UPS 以按正确的顺序重启服务器?

如何配置 UPS 以按正确的顺序重启服务器?

这里我们有一些服务器,几乎每个服务器都有专用的 UPS。它们之间存在依赖关系,因此必须按照正确的顺序打开它们。最终,我们的电源出现了严重问题,因此服务器关闭,然后在电源恢复时以随机顺序重新启动。如果服务器在停电期间关闭,这不是问题,重要的是一旦电源恢复,它们无需任何人工干预即可正常工作。

我们的 UPS 非常便宜,对我的目标有用的唯一配置参数是power the load xx seconds after power is restored。理论上,在每个 UPS 上设置正确的延迟,我可以修复服务器重启的顺序,但我不相信 UPS 会按预期运行。

这是正确的做法吗?
高水平的 UPS 是否提供了其他选项来修复重启顺序?
最后说明一下:我的 UPS 的功率范围是 1000 - 2200 VA

答案1

对此的标准答案是“根本不会”。修复软件以按随机顺序处理重启。如果您确实需要先启动某些服务器(例如:Active Directory),请将它们放在可能存活时间更长的 USV 上。低功耗的基于原子的服务器足以作为 Active Directory 控制器,并且可以在小型 USV 上存活一天。

高级 UPS 是否提供其他选项来修复重启顺序?

不,我想说的是,人们普遍认为程序员有足够的能力妥善解决这个问题。

您可以做的是:

  • 让服务器“随机”启动。除了 DHCP/Active Directory 之外,没有什么真正需要无法固定的顺序。
  • 让控制服务器在一段时间(5 分钟)后按照正确的顺序启动各个机器上的服务。

我想说这种设置更为常见。我认为任何需要服务器以特定顺序启动的软件(纯基础设施之外)都是有问题的,不适合业务。

请注意:我们自己的设置是一台低成本的 20kva USV(低成本是因为我们使用的是一台二手的),用于服务器,一台从属的 2000VA USV 用于作为网络“根”(和备用机器)的机器。从属意味着 USV 位于大型 USV 后面 - 因此它只在大型 USV(持续时间为半小时到 8 小时,具体取决于我们的计算网格有多少在线)进入终端关闭状态时切换到电池。

答案2

管理配电单元(而不是 UPS)通常确实支持在电源恢复后定制启用单个插座的延迟。

通常这是为了防止在电源恢复后立即启动装满系统的机柜时断路器跳闸,但这也可以用于保留系统依赖项的启动顺序。

答案3

我也遇到过同样的问题。唯一的区别是我们投资了坚固的机架式 APC 电源装置(例如APC SmartUPS 3000). 使用 APC PowerChute 网络关机软件 (PowerChute 网络关机软件),我可以按特定顺序关闭和启动服务器。该软件的另一个方便的功能是将服务器设置为在最后一分钟关闭,即计算 APC 单元剩余的电池电量,并在有足够的时间关闭服务器,以便它们正常关闭,而不是直接关闭电源。

该软件...不是用户友好的,但只要你花点时间弄清楚,它并不难。如果你有兴趣在基础设施上投入更多,这绝对是一条路。

答案4

听起来 UPS 设备成本低廉,无法配置电源恢复后的特定输出开启等待时间(某些高端设备可以)。要获得相同的功能,您需要选择一个始终立即开启的特定主机(可能是允许随时启动的任何系统),并让所有其他服务器处于关机​​状态(在 BIOS 中配置为在接通交流电时返回关机状态,并遵守网络唤醒魔术包,在收到通知时开启)。然后,在启动的主主机上运行脚本/实用程序来计时将 WOL 魔术包传输到每个主机。

相关内容