今天早上,我正在帮助 BA 处理一份特别复杂的报告。我注意到,在报告开发环境中,我们只能看到一天的数据。不仅如此,这一天的数据来自一个时间段,在这个时间段里,数据本身并不是特别有用,也不能说明生产情况。
我大胆地问道:“为什么开发环境中没有更多最新信息?” BA 回复说:“我们无法更新 Dev,因为存在空间问题。”
在我的职业生涯中,我曾在几家不同的公司工作过,经常听到我们没有足够的磁盘空间。我们无法运行该报告;磁盘空间不足。我们无法存档超过一个季度的文件;磁盘空间不足。各位,放下手头的工作,清理网络上的工作区;我们的磁盘空间已经快用完了。等等等等。
怎么回事?我花大约 1000 美元就能买到一堆 1TB 的硬盘,甚至我家里的个人电脑也有一个基本的 RAID。所有 NAS 都是那还是说,我的职业道路仅仅是碰上了一群守财奴或 PHB?
我不明白这里什么?
谢谢,
IVR Avenger
答案1
怎么回事?我花大约 1000 美元就能买到一堆 1TB 的硬盘,甚至我家里的个人电脑也有一个基本的 RAID。所有 NAS 都这么贵吗?
当我们告诉用户增加更多空间需要花费多少钱时,我经常在内部遇到这个问题。在我们的一个阵列上,这非常昂贵,这是一个非常大的问题。但是,这是一个全面升级(6 位数的更换成本),因此不会在未来 12 个月内发生。这是一种“吝啬鬼”故障模式。
我在两年前的一篇博客文章中计算过我们的两个阵列的每 GB 成本数字(关联如果您想阅读全文)。在一个阵列上,每 GB 成本高达 16.22 美元,在另一个阵列上则为 3.03 美元。一旦将备份和灾难恢复覆盖成本考虑在内,数字分别上升到 26 美元和 7.50 美元。这是针对光纤通道连接企业存储而设计的,旨在同时处理大量 I/O 请求。
我刚刚为另一个新的阵列系统编写了规范,该系统的目标成本约为每 GB 2 美元(不包括备份/灾难恢复覆盖)。这是针对 iSCSI/NAS 设备的。由于没有光纤通道,它的价格明显便宜,但我们为此付出的代价是实际阵列的弹性降低。它可以完成 I/O 操作,但其扩展性不如基于 FC 的阵列。
在计算每 GB 的存储成本时,您必须记住数据会被复制任意多次。RAID 级别会影响这一点。备份基础设施的运行深度是一个重要的成本因素(如果您必须保留 7 年的数据,并且每周保留一份完整副本,那么您的数据可能会被复制 365 次。这需要大量磁带,这就是重复数据删除供应商收取高额费用的原因)。直接支持实际硬盘的存储基础设施需要在该基础设施中包含的所有存储中摊销。此外,还需要任何支持合同,以使所有这些都可支持。
让需要大存储的部门苦不堪言的是,存储供应商是最后推出大容量硬盘的。您已经看到很长时间的 2TB SATA 硬盘现在才开始从 HP、EMC 和 Dell 等公司推出。这在很大程度上是因为这些全新的存储层没有足够的使用历史来押注(或者换句话说,准确定价支持合同成本)。我最近构建的那个廉价阵列基于 750GB 3Gb SAS 硬盘,而不是 2TB SATA 硬盘。
答案2
你不明白什么?
- 贮存容量以相当快的指数速度增长,比 CPU 速度、内存密度等要快一点……(每 15 个月翻一番,而不是每 18 个月)
- 贮存速度已经落后,延迟正在慢慢下降。存储单个用户系统很便宜,但对于多用户系统(服务器),您可能需要的驱动器数量可能与几年前一样多。空间效率更高的 RAID 形式的 RAID 奇偶校验计算会给您带来第二个写入瓶颈。
- 该存储需要管理,这是人力时间问题
- 该存储需要备份等。这使企业存储的成本大大高于单个驱动器的成本,并且还增加了人力成本。
- 他们可能在一年前就购买了所有存储空间,因此每 TB 的成本是当前成本的两倍甚至更多。
- 他们可能正在购买高端硬盘(出于许多好的理由和一些可疑的理由),其价格比您所说的便宜的 1TB 硬盘更高。
根据我的经验,在磁盘上的可用块耗尽之前,存储的 I/O 就已经耗尽。用“空间不足”这样的简单术语来回答要比用“存储的 I/O 容量已达到 50% 并且不想超过这个容量以保持足够的空间来应对使用高峰”这样的解释更容易。
答案3
两者都有。首先,企业数据与 RAID 无关。它与 RAID 和更底层的备份有关,因此成本较高。
其次,大多数公司不理解速度慢和容量大的问题,这是他们自己的愚蠢行为。哎呀,我可以买一个特殊的磁盘盒(5 个机架单元高),可以容纳 48 个驱动器。我放入大型 3.5 英寸驱动器,就安全了。但大多数大型公司只谈论 WAN、速度快、2.5 英寸。
第三,这大多也是因为懒惰和为了省钱而导致的。