如何在 Linux 上的本地网络中设置计算集群

Question

这是一个过于宽泛的主题，无法在这里详细讨论，但作为一个快速概述，您将需要：

将其中一台机器设为头节点或控制节点。这可能也应该是存储服务器。它可能应该是 LAN 上 a) 使用最少且 b) 拥有最多存储空间（或用于安装更多存储空间的驱动器托架）的计算机。您应该在此机器上提交批处理作业。

顺便说一句，控制节点也可以充当计算节点。

另外两台机器应该是“计算节点”，以及存储服务器的客户端（例如，如果使用NFS，它们应该挂载NFS服务器导出的NFS目录）。

您可能不想走这么远，但在专用集群上，您将有一台或多台机器作为存储节点（nfs 或头孢或其他），还会有一些集中式身份验证服务器（尼斯或者LDAP或其他），并且头节点和计算节点的所有用户都将从文件服务器挂载其主目录。

然而，值得研究一下“真正的”集群是如何设计和构建的（或者至少得到一个概述），因为您可以从中获得一些很好的想法，可以缩小到 3 节点集群。

Answer 1

这是一个过于宽泛的主题，无法在这里详细讨论，但作为一个快速概述，您将需要：

将其中一台机器设为头节点或控制节点。这可能也应该是存储服务器。它可能应该是 LAN 上 a) 使用最少且 b) 拥有最多存储空间（或用于安装更多存储空间的驱动器托架）的计算机。您应该在此机器上提交批处理作业。

顺便说一句，控制节点也可以充当计算节点。

另外两台机器应该是“计算节点”，以及存储服务器的客户端（例如，如果使用NFS，它们应该挂载NFS服务器导出的NFS目录）。

您可能不想走这么远，但在专用集群上，您将有一台或多台机器作为存储节点（nfs 或头孢或其他），还会有一些集中式身份验证服务器（尼斯或者LDAP或其他），并且头节点和计算节点的所有用户都将从文件服务器挂载其主目录。

然而，值得研究一下“真正的”集群是如何设计和构建的（或者至少得到一个概述），因为您可以从中获得一些很好的想法，可以缩小到 3 节点集群。

相关内容