我认为我的雇主拥有大量数据。目前我们的 NAS 上有大约 10TB 的数据,这差不多是它的容量,如果我们不经常将数据移到外部硬盘和 DVD 上以释放空间,我们上面会有更多的数据。因为我们需要使用所有这些数据,而且我们没有能力存储更多数据,所以我们的备份一片混乱。
根据我的计算,为了存储我们所有的数据以及我们的档案和备份,我们将需要大约 200TB 的存储空间,这也解释了未来几年预期的增长。
我的问题是,需要 200TB 的存储空间,我们应该考虑设置 SAN,还是应该考虑购买大型 NAS(如 Netapp 设备)或其他完全不同的东西?什么时候数据存储需求会变得大到足以保证设置和管理 SAN 所需的努力?
答案1
如果您负担得起,集中式存储系统是安全可靠地提供公司数据的理想选择。
话虽如此,但请检查一下您的数学知识 - 虽然将服务器和计算机备份到 NAS 是可以的,但这几乎从来都不是最佳选择。存档也不适合 NAS。存档和备份最好放在磁带驱动器或重复数据删除磁盘池等其他设备上。无论哪种方式,您都需要这样的东西来备份存储在 NAS 上的主要数据。
答案2
对于 200TB,您确实需要一个阵列。但是,如果您试图比较 SAN 和 NAS,那么您的想法就错了。它们是用于不同工作的不同工具。
NAS 可通过网络访问 - 通常提供 NFS 或 CIFS 存储,有时提供 iSCSI。(有时提供 FCOE)。
SAN 通常意味着通过 SCSI 向主机提供块存储的光纤通道网络。
从根本上来说,SAN 是一种专用于存储的高速、低延迟网络。
不过,无论哪种情况,您谈论的阵列仍然非常相似 - 它是一组在 RAID 集中配置的磁盘。(您使用哪种配置取决于预算和性能要求)。
所以真正的问题是 - 您需要多少性能或并发访问?以太网上的 NFS 和 CIFS 适用于中等性能负载(尤其是在 10G 网络上),但协议开销总是比光纤通道大。然而,它们也非常适合在多个主机/用户之间共享存储以实现并发访问。
SAN 的成本开销更大 - 每台服务器至少一对 HBA,以及光纤交换机上的端口。但速度往往更快。
除此之外,备份/存档磁盘配置文件和前端存储之间存在差异 - 前端存储需要良好的峰值性能。备份实际上不需要。
答案3
如果您的预算紧张、有一点空闲时间并且具备一些极客技能,那么您还可以考虑使用一些分布式文件系统,如 MooseFS 或 GlusterFS(更多选项在这里:http://en.wikipedia.org/wiki/Comparison_of_distributed_file_systems)。我之前的工作中用过 MooseFS,它作为文件存储效果很好。它不会像 NetApp 那样快,但便宜得多。而且您不会受限于特定的硬件供应商,因为您可以将任何东西连接到 DFS 来扩展存储(服务器、台式机、带有任何类型磁盘的笔记本电脑)。当然,在这种情况下,网络带宽将成为您的瓶颈。