机架功率消耗可靠性

机架功率消耗可靠性

我负责几个机架上的设备,并且作为数据中心效率项目的一部分,我需要移动一些设备。

我在处理这些服务器时遇到的一个限制是 PDU 负载。计划的一个特定部分涉及将大约 5 安培的设备移到带有两个 120V PDU 的机架中9.09.5独立 20 安培断路器上的 500 安培。我之所以担心,是因为机架中的总电流已经超过 1 个断路器的 80%,如果我们再增加 5 安培,当一个电路发生故障时,增加的负载将导致断路器跳闸(又称为级联故障)。

我的主管说没问题,因为服务器 PSU 只从一个 PSU 供电时效率更高。这样我们就可以在不牺牲N+1 冗余

主任说得对吗?为什么?给定一对 120V 机架,正常运行期间应保持在以下哪个阈值以下比较好?

答案1

您的主管 10 年前说得对。(也许应该改述第 3 段)现在(进行 Google 图片搜索)现代 PSU 在低负载下的效率比旧 PSU 高得多。

说到第三段。根据服务器的配置方式,有时 PSU 实际上并非冗余,很有可能服务器的 PSU 串联在一起,并非冗余。而且许多服务器可以在一个服务器上运行。最近我在数据中心看到了很多单 PSU 机器。但我不会信任较旧的服务器。

此外,在指定机架/PDU 负载时​​,您需要根据服务器中的 PSU 进行判断。大多数服务器可以闲置以节省电力(并且闲置很多),但这通常会诱使人们超载 PDU。我曾见过断路器弹出,整个机架都断电,因为“当我将它们全部插入时,显示屏显示只有 12A”......“是的,直到您将工作推送到服务器,然后它们开始运转,嗯,看起来这里有 20+ 安培的服务器”教训:不要看显示屏。

还有成本效率(希望老板想的就是这个)。大多数数据中心按功率收费。所以如果你有 3 x 2.4kW 机架,那么这就是你要收取的费用。即使什么都没插上,你也不会用电。所以把这些 PDU 的负载调到 80% 的限值。20A 上 15 安培。15 上 11A。60A 上 45A ;-)(始终注意单相(有些人会错误地说成双相,因为有 2 个热源)或三相和 RMS 电压。不用担心 PF。无论是冗余的还是主要的)

您很聪明,能够意识到连锁故障……您可能需要进行说服和负载测试(一些 Linux 启动盘并运行一些服务器压力工具)。然后放下一个 PDU,观察服务器跳转到另一个 PDU 并放下该 PDU。此外,为了表明即使服务器不会一直获得评级,您仍然需要在 PDU 负载中考虑它。计划好这件事,并打算在周日做。如果主管仍然坚持让 PDU 超载。为了增加戏剧性,请将步骤 1 改为“检查灭火器电量”,这有助于说服 ;-)

电压有点重要,但瓦数和熔化部分:安培数也很重要。取您支付的费用并乘以 0.8;20Amp * 0.8 = 16,我喜欢 15 作为缓冲。现在 120V 机架 * 15 = 1,800 瓦(2.4kW 机架)。现在找到服务器 PSU 上的瓦数,将它们加起来,并希望它小于 1,800 瓦(或您计算的任何值)。这就是您应该将机架装载到的,不要忘记包括交换机和从 PDU 拉动的任何其他东西。

相关内容