我正在设置一个 beowulf 集群,我读到过,可能需要让集群用户的主目录在他们之间共享(假设这些用户是每台机器的本地用户)。另一种情况是让每个用户都有自己的主目录,通信由主节点负责。另一个想法是使用登录集群中每台机器的 LDAP 唯一用户,这样可以保持节点之间共享主目录的想法(但每个用户只有一个主目录)。
对于这种集群来说哪种方法更好?
编辑:集群正在运行 openmpi,它将支持 cuda 和 opencl
答案1
你走对了路。你绝对应该使用 ldap 来验证除系统用户(root、守护进程等)之外的所有用户。这样,你就可以得到一致的 uid/gid,这对于下一步 NFS 至关重要。
/home
通过 NFS 从中央主机挂载,或者使用自动挂载在访问/登录时挂载各个主目录。