HPC集群管理软件

HPC集群管理软件

我们有一个运行 RHEL 6 的小型集群,大约有 40 个节点。该集群使用 rocks 进行管理,非常方便。要关闭节点,我只需执行以下操作:

 rocks run host halt

我还可以非常轻松地将软件安装到所有节点、管理用户等。我们希望使用 ubuntu 22 进行升级,因为 RHEL6 太旧了。我注意到有 openHPC,但没有适用于 ubuntu 的二进制文件。所以我的问题是,有哪些适用于 ubuntu 的等效软件可用于此?

目标:

  1. 操作系统配置
  2. 关闭节点
  3. 安装软件
  4. 管理和同步用户

相关内容