HPC / EC2 - 优化 NFS 以提高可靠性

Question

对于正在使用的集群大小，考虑迁移到并行文件系统可能是一个好主意，例如格鲁斯特或者，如果集群配置正确，则每个节点都应该通过 DNS 或查找了解每个其他节点，/etc/hosts并且应该具有适当的 ssh 密钥，以便无需密码即可访问它们。

如果是这样，每个节点可以在完成计算/压缩后简单地复制文件，这样就不需要 NFS 了。虽然这种解决方案可能不会提供最佳性能，但根据计算节点、网络和存储虚拟化的性质，它可能是一个不错的选择。

您使用的是哪种集群管理/配置系统？通常在设置头节点时，还会设置用于计算节点的适当共享存储。使用类似沃尔伍尔夫或者岩石可能有助于确保计算节点正确配置，并且有许多使用这些工具在线提供的集群的指南和参考设计。

Answer 1

对于正在使用的集群大小，考虑迁移到并行文件系统可能是一个好主意，例如格鲁斯特或者，如果集群配置正确，则每个节点都应该通过 DNS 或查找了解每个其他节点，/etc/hosts并且应该具有适当的 ssh 密钥，以便无需密码即可访问它们。

如果是这样，每个节点可以在完成计算/压缩后简单地复制文件，这样就不需要 NFS 了。虽然这种解决方案可能不会提供最佳性能，但根据计算节点、网络和存储虚拟化的性质，它可能是一个不错的选择。

您使用的是哪种集群管理/配置系统？通常在设置头节点时，还会设置用于计算节点的适当共享存储。使用类似沃尔伍尔夫或者岩石可能有助于确保计算节点正确配置，并且有许多使用这些工具在线提供的集群的指南和参考设计。

相关内容