由于我的问题,有些令人困惑,因此为了简单起见:
“大型云提供商使用什么样的存储?为什么?”
据我所知,我无法找到典型数据中心和云之间的任何官方存储网络差异,所有云提供商都使用与典型数据中心不同的 DAS。
尽管 DAS 比 SAN 或 NAS 有很多缺点,但我想了解云使用 DAS 进行存储或应用目的的详细信息。
任何资源或描述如果能让我清楚了解,我将不胜感激。
编辑:在阅读论文“大规模云构建的网络挑战和相应方法”时,David Bernstein 和 Erik Ludvigson(思科)提到,
奇怪的是,我们没有看到主要提供商的云使用 NAS 或 SAN。典型的云架构使用 DAS,这不是数据中心存储方法的典型做法。
但这里有一个冲突:在我看来并且也在论文后面指出,云应该使用 SAN 或 NAS,因为当 VM 移动到另一台服务器但仍需要从原始服务器访问存储时,DAS 并不合适。
还有哪些原因影响云选择 DAS、NAS 或 SAN?大型云提供商使用哪种存储以及为什么?
答案1
问题澄清后,该答案已被编辑。
影响云选择 DAS 的其他原因有哪些
其中“DAS”表示直接连接存储,即 SATA 或 SAS 硬盘驱动器。
所有云供应商都使用 DAS,因为它在性价比方面提供了数量级的改进。这是水平扩展。
简而言之,SATA 硬盘驱动器和 SATA 控制器是廉价商品。它们是大众市场产品,价格非常低廉。通过使用廉价 SATA 驱动器构建大量廉价 PC 集群,Google、Amazon 和其他公司以非常低的价格获得了巨大的容量。然后他们在上面添加自己的软件层。他们的软件进行多服务器复制以提高性能和可靠性、监控、在硬件故障后重新平衡复制等。
你可以看看移动文件系统作为 Google、Amazon 和其他公司用于存储的软件的更简单代表。当然,这是一种不同的实现,但它与大型系统共享许多相同的设计目标和解决方案。如果您愿意,这里有一个起点,可以了解更多谷歌文件系统。
论文后面提到,云应该使用 SAN 或 NAS,因为当虚拟机移动到另一台服务器时,DAS 并不合适
不使用 SAN 的原因有两个。
1)价格。 SAN 在大规模情况下非常昂贵。虽然从技术上讲,SAN 可能是“最佳”解决方案,但由于成本原因,它们通常不用于非常大规模的安装。
2)CAP 定理 Eric Brewer 的 CAP 定理表明在非常大规模的情况下,您无法在保持可接受的可靠性、容错性和性能的同时保持强一致性。SAN 是一种在硬件中实现强一致性的尝试。这可能适用于 5,000 台服务器的安装,但它从未被证明适用于 Google 的 250,000 多台服务器。
结果: 到目前为止,云计算供应商选择将维护服务器状态的复杂性转嫁给应用程序开发人员。当前的云产品不为每个虚拟机提供一致的状态。应用程序服务器(虚拟机)可能随时崩溃,其本地数据可能随时丢失。
每个供应商都有自己的持久存储实现,你应该用它来存储重要数据。亚马逊的产品就是很好的例子;MySQL,简单数据库, 和简单存储服务。这些产品本身反映了 CAP 定理——MySQL 实例具有很强的一致性,但可扩展性有限。SimpleDB 和 S3 可扩展性极佳,但最终只能达到一致性。
答案2
如果你使用 DAS,那么可用性就是您的问题
如果他们使用 DAS,那么可用性就是他们的问题。如果他们做得好,他们会使用多个抽象层来确保他们的问题不会成为您的问题。问题不是纠结于他们如何选择在数据中心内安装磁盘,而是他们在 SLA 中保证的可用性是否足以满足您的需求。哦,真正的问题是,如果他们倒闭了,你会怎么做(对于某些提供商来说可能不太可能,但您仍然应该考虑这一点),如果你在本地使用这些数据并且您的互联网连接不可用,你会怎么做——后者比他们选择 DAS 直接导致中断的可能性大得多。
答案3
虽然我不知道 DAS 与 SAN/NAS 孰优孰劣...但在寻找存储解决方案时需要考虑很多事情。
数据量?如果是 Gb 级,那没问题,带备份的 NAS 就可以完成任务。如果是 TB 级数据,价格就会迅速上涨。
我认为价格是主要因素...如果您有 SAN,您需要:
- 管理员对其进行配置/管理。
- 服务器机房(电力、带宽、房间周围的安全措施......)
但你仍然没有任何冗余。如果你可以访问数据中心,情况可能会有所不同。
另一件需要考虑的事情是可访问性。您要存档吗?如果可访问性不是问题,那么每天/每周/每月可以存档几次到您的存储解决方案中。
另一方面,如果您有需要不断访问的数据,您很快就会发现带宽瓶颈、硬件限制(如 I/O)。但另一方面,如果您的数据传输量很大,那么在线存储解决方案很可能会花费您很多钱。
所有在线存储解决方案供应商都宣传投资回报率 (ROI),而他们的宣传往往是正确的,当然,这取决于使用情况。
祝你好运。
答案4
(仅代表观点,且具有极大的概括性。)
不同之处在于您所查看的抽象层(通常)。
SAN/NAS 通常为您提供一个卷,您可以在其上安装文件系统。这种方法对终端系统的价值在于,您已经将物理硬件的详细信息(例如 RAID 级别、物理位置等)外包出去了。
相比之下,云存储通常为您提供文件系统的接口。这样做的好处是,您通常可以免费获得更高阶的功能(例如,Dropbox 透明地自动对每个文件进行版本控制)。