我想在带有 Slurm 资源管理器的 Linux HPC 集群上安装 OpenMPI。我知道如何从源代码定期构建 OpenMPI,但是,如何安装它以便它也正确安装在计算节点上?
答案1
就像你的一样类似的问题答案mpich
是在集群的每个节点上安装您的发行版提供的 OpenMPI 打包版本。
你运行的是 Ubuntu,所以:
apt-get install openmpi-bin
该openmpi-bin
软件包依赖于libopenmpi2
,openmpi-common
因此安装它会导致它们自动安装。
您可能还想在另一台计算机上(可能在集群的头节点上)安装文档 ( openmpi-doc
) 和/或开发标头和库 ( ) libopenmpi-dev
- 计算节点上不需要这些。
顺便说一句,如果您已经pdsh
在头节点上进行了安装和配置,则可以openmpi-bin
使用一个命令在整个集群上进行安装。例如
pdsh -g all 'apt-get update && DEBIAN_FRONTEND=noninteractive apt-get -y install openmpi-bin'
仅供参考,pdsh
(“并行分布式 Shell”)由以下人员编写LLNL(他们也是 的作者slurm
),以帮助自动化管理其集群。它被编写为 IBM 程序dsh
(“分布式 Shell”)的增强型开源克隆
另外顺便说一句,您可以在以下位置找到 Ubuntu openmpi 软件包和使用 OpenMPI 的软件包的列表:https://packages.ubuntu.com/search?keywords=openmpi
该列表包括每个 Ubuntu 版本可用的软件包版本。