Linux 集群上的节能

Linux 集群上的节能

我想购买一个集群(30-60个节点)用于工作并在其上安装linux。例如,集群应该有一个像 PBS 这样的队列系统。它还应该能够进行并行计算。我自己对配置集群和维护集群不太了解,但我们的 IT 人员知道的更少,我更愿意成为负责这些机器的人。

我的问题是:是否有一些简单的(软件)方法可以通过在没有作业运行时关闭或让节点进入睡眠状态来节省这些机器的电量?它可以连接到队列管理器吗?

抱歉没有说得更清楚,但这是我第一次必须成为具有两个以上处理器的任何事物的系统管理员。

答案1

这是一个棘手的问题,可能需要您和您为其构建集群的人员进行一些代码开发和思考:

  • 什么时候应该关闭节点?
  • 应该什么时候提出来?
  • 当节点启动时,您确定它已与其他节点同步(是否需要软件更新?)

除了引入专业人士之外,节省一点电的一个好方法是查看一些可用于 Linux 的节能实用程序并开始使用它们。 PowerTOP 是一个很好的开始,让您了解可以在哪里节省成本。更具体地说,像 hdparm 这样的东西可以为您降低磁盘速度(也许)。最后,您可以查看 cpufreq 来设置 CPU 速度,并在没有其他程序运行时降低速度以节省电力。并非所有 CPU 都支持此功能,因此您可能无法扩展那么多。

我通常让我的集群 24x7 保持运行,因为它的使用率非常高。如果您确实担心大多数时间不会达到 100% 使用率,您可能需要考虑一下按需云集群,例如星团这为您提供了一个任意大小的现成集群,无论您想要多长时间。

答案2

要关闭电源,可以使用 ssh with shutdown 来关闭电源。您可以使用许多/大多数主板支持的 LAN 唤醒功能来在需要时打开节点。

另一个考虑因素是存储。如果关闭节点,它们的存储将无法贡献给集群的存储池......

相关内容