网络附加存储对于某些云应用程序来说到底有多糟糕?

网络附加存储对于某些云应用程序来说到底有多糟糕?

我听说建议远离 AWS 托管某些“大数据”应用程序(例如 Hadoop、Cassandra、Solr),因为 EC2 实例通常使用网络附加存储(尽管最近有一些高 i/o 实例,但它们显然非常昂贵)。

我认为 NAS 会带来相当大的性能损失,但损失有多大呢?既然 AWS 已经存在,那么可能有很多应用程序在这种环境中是有意义的,但有什么好的经验法则可以确定特定的应用程序是否适合 AWS 和 NAS?(除了将其放在 AWS 上并进行尝试。)

答案1

存储延迟将是您的衡量标准。

如果您的应用程序对存储延迟非常敏感,那么您将希望避开 AWS 并采用物理方式,或者花钱购买存储优化实例。他们明确指出这些是适用于 Hadoop 和 Cassandra 之类的类型。

关于 AWS 实例类型的更高层级,它不是 NAS,而是 NAS 支持的物理。细节尚不清楚,但当您运行针对集群优化的存储优化实例时,您会更接近硬件。

答案2

我在 AWS 上运行 Cassandra 集群,我同意您读到的关于远离 NAS(EBS)的观点,我最近搬到了 hi1.4xlarge 盒子(它们配有 2 个 1TB SSD),我将它们 RAID0 以充分利用它。使用此设置,我可以轻松处理 15k 读取/秒,我的应用程序不太面向写入,所以我无法帮助您。希望这能有所帮助。

相关内容