我们有许多未使用的 PC 机,我们想用它们来建立高性能计算应用的教育实验室。哪个 Linux 发行版在教育环境中设置最方便且易于管理?如果有人向我提供不同 Linux 集群发行版的优缺点列表,我将不胜感激。
答案1
有的是岩石linux 发行版,专为集群而设计,基于 CentOS/RHEL。
Rocks 的优点在于它通常会为您处理并完成许多细节。
- 它将自动安装和重新安装,如果您的计算机可以通过 PXE 启动,则初始安装将包括 PXE 启动您的节点。如果您有大量计算节点,它们会在内部使用 BitTorrent 来分发软件包,这消除了(重新)安装整个节点的重大瓶颈。
- 默认情况下,它会为您提供一个非常同质的计算环境。
- 默认情况下,它将在内部设置和使用 NFS,并且有使用 PVFS2 的选项(我还没有尝试过)。
- 至于排队/批处理系统,它应该为您设置和管理它,默认情况下我认为它使用 SGE,还有一个用于扭矩的滚动(他们的软件捆绑格式)。
- 它将确保用户/组等的一致性。跨集群
- 它将通过神经节绘制资源利用率图
如果我要挖掘缺点
- 从计算节点添加/删除软件涉及重新安装它们(尽管它确实确保了同质性)。
- 添加/删除软件涉及添加卷(他们捆绑 rpm/设备的方式)或编辑 xml 文件。但是,它有相当详细的文档,因此如果您愿意花一些精力阅读文档,那么应该没问题。另外,如果您遇到困难,还有一个邮件列表。
- 它基于 CentOS/RHEL,有点落后于“前沿”
- 它(大部分)会强迫你按照“他们的方式”做事,你可能会通过修改一些 xml 配置文件来进行一些小的更改,而重大的更改可能必须通过制作、添加或修改卷(他们的软件)来实现。 /插件格式)
答案2
我们有一个以 openSUSE 作为基础发行版的小型集群,但我认为它不是太重要。 Ubuntu 看起来是一个可行的替代方案,并且有相当多的文档和社区支持。在 Linux 之上,我们运行 Sun Grid Engine(我们的集群甚至非常无缝地包括 Mac OS 机器),但 slurm 可能适用于简单的设置。我们通过 NFS 从中央服务器共享主目录和 /usr/local。它对我们来说效果很好。更多细节是可在我们的网站上找到(通过互联网档案馆)。