企业存储系统上的 ZFS

企业存储系统上的 ZFS

企业存储(例如 EMC、NetApp 等公司的系统)拥有自己的算法和方法来确保不会丢失数据。在将大量服务器连接到此类存储系统的情况下,如果我使用 ZFS 作为文件系统,会有什么好处吗?存储自身的功能是否能够提供最佳可行的数据完整性、压缩、重复数据删除等,从而使我的所有努力变得多余?因此,在这种情况下,XFS、UFS 或其他文件系统不是更可取吗?

答案1

正如 Andrew Henle 所说,你基本上无法保证这个黑盒存储系统能满足你的要求。当然,它很可能已经满足了你的所有要求,甚至可能在内部使用了 ZFS,但你并不确定。即使你确切知道,你很可能也无法完全按照自己的喜好进行配置。

因此,你可能会遇到三种不同的情况:

  1. 您对系统一无所知,也无法以任何有意义的方式对其进行配置。大多数云存储都属于这种情况,大型公司的存储系统也是如此,如果您的项目需要存储,您只需请求一定大小的“存储空间”。
  2. 您知道系统如何工作和配置,但您无法自己配置它。
  3. 您知道它是如何工作的,并且可以主动修改它(您自己可以通过授予权限或告诉管理员来修改)。最有可能在较小的操作中,你们彼此认识,或者人们知道应该满足不同的需求。

这就引出了以下问题:“在顶部使用 ZFS 是有益的,还是浪费,甚至是有问题的?”的答案:

  1. 由于没有保证,您几乎可以得到所有功能,但唯一的缺点是性能。您可能需要进行大量基准测试和测试才能了解系统的工作方式,但可能您永远无法获得足够好的性能。当然,这可能都是徒劳的,但因为您不知道,所以您保持安全。
  2. 类似于 1,但现在您知道了它的工作原理,您可以更好地优化性能,或者在最坏的情况下知道性能不佳的原因。您还知道您已经拥有哪些功能,因此您可以做出更明智的决定,看看 ZFS 功能是否值得您使用。
  3. 类似于 2,但现在您可以主动配置和优化存储系统,因此您更有可能不需要 ZFS。即使您需要,您也许可以同时使用两者以最大限度地减少性能损失。

答案2

CERN 的研究表明,即使是非常昂贵的存储系统也会遭受位衰减。此外,他们的研究表明 ZFS 不会遭受位衰减。此外,独立计算机科学研究人员也表明 ZFS 不会遭受位衰减。这就是 CERN 转向 ZFS 的原因。此外,IBM Sequoia 超级计算机使用 Lustre 存储 55 PB 数据。Lustre 是一种并行存储系统,使用 ZFS 进行磁盘上的实际存储。谷歌搜索 CERN 和 ZFS,你会看到很多关于数据完整性的研究论文。此外,维基百科上关于 ZFS 的文章也有关于数据完整性的研究论文。

相关内容