我正在规划一个由 3 个主动-主动节点组成的集群,运行 Red Hat Linux 6.7,具有本地和共享文件系统,以便 3 个服务器可以同时读取/写入一些共享文件。但是,我的系统管理员告诉我,如果集群文件服务宕机,那么所有 3 个节点都会宕机,有什么集群方法可以克服这个问题吗?
答案1
您的管理员是正确的,如果集群文件系统中的节点之间有一个共享操作系统并且集群失败,则所有节点都会关闭,因为它们无法访问操作所需的重要文件。
您也是正确的,如果每个节点都有自己的操作系统并且集群失败,您应该只失去对集群内文件的访问,因为必要的操作系统文件将位于本地。您没有提及您正在使用什么集群,因此可能需要一些进一步的机制来确保失败的集群不会挂起系统。
看起来您的集群仍然是共享文件的单点故障,但如果它没有删除整个主机,可能会让您的管理员感觉更好。