我有一个包含 22 个节点的 HPC 集群,其中一个头节点作为主节点运行Rocks集群操作系统(基于 CentOS)。
节点和主节点通过专用网络 ( 10.10.0.0/16
) 进行通信。我们ssh
使用路由公共网络 ( 192.168.xxx.xxx/24
) 来连接服务器,并且该网络未路由到工作节点。
现在我们的数据已经达到了极限,我们无法再向master添加磁盘了。
现在我们想要建立一个光泽簇由 2 个 OSS 和 1 个 MDS 组成。我的问题是...
我们是否必须将 Lustre OSS 和 MDS 连接到与 HPC 节点 ( 10.10.0.0/16
) 相同的网络,以便节点可以作为 Lustre 客户端挂载我们的新 LustreFS?
或者我们可以只在主节点上安装Lustre客户端,并通过NFS为HPC工作节点共享Lustre槽?
我们将在 HPC 环境之外拥有其他 Lustre 客户端,因此我们将在192.168.xxx.xxx/24
.
有什么建议吗?
答案1
我们是否必须将Lustre OSS和MDS连接到与HPC节点(10.10.0.0/16)相同的网络,以便节点可以作为Lustre客户端挂载我们的新LustreFS?
由于 Lustre 是一个高性能的并行文件系统,并且集群网络在某种程度上是私有的,所以是的。
或者我们可以只在主节点上安装Lustre客户端,并通过NFS为HPC工作节点共享Lustre槽?
对于并行文件系统来说,不,这是不可行的。