分布式存储

分布式存储

在我的大学部门,我们即将升级学生实验室的计算机(约 25-30 台机器)。这些机器将运行 Linux。

新机器的一个特点是它们有巨大的(1TB)硬盘(我们没有要求它们,但无论如何,这些天你找不到相当便宜的磁盘!)

目前,用户主目录存储在中央文件服务器上并通过 nfs 安装。

那么问题是,我们有没有办法利用所有这些磁盘容量?我会考虑

  • 扩展我们的中央文件存储,或者
  • 复制主目录以便更快地访问。

主要问题是实验室机器不能保证一直处于运行状态。

浏览这个网站时我读到了集群文件系统先进先出系统

GlusterFS 似乎有很多朋友并且是一个很好的通用解决方案。

AFS 怎么样?我听说它有性能问题,有使用经验吗?

答案1

我曾经有过这样的经历,不想“浪费”看似不错的存储空间。但这并不“好”,试图将该存储空间用作本地以外的任何用途都是愚蠢的行为。系统必须在每台机器上保留所有内容的完整副本,因为它永远不知道哪台机器将要打开/关闭。仅复制流量就会对您的网络产生明显的影响。

如果你真的想要使用这些磁盘,将它们从工作站中拉出(PXE 启动工作站)并在 SAN 中使用这些磁盘(在 SAN 中也有许多理由反对使用消费级磁盘!)

答案2

你看过 CEPH 文件系统了吗http://ceph.com/ceph-storage/

另外,关于缓存,如果你真的想要这个,你可以尝试 CacheFS,这里有一篇很好的文章http://www.c0t0d0s0.org/archives/4727-Less-known-Solaris-Features-CacheFS.html

相关内容