amazon-ephemeral

用于 HDFS 的 EC2 实例存储的最佳 RAID 配置
amazon-ephemeral

用于 HDFS 的 EC2 实例存储的最佳 RAID 配置

我正在尝试确定在用于 HDFS 的 3x d2.2xlarge 实例的实例存储上配置 RAID 阵列是否有任何实际优势。最初,我计划只安装每个存储并将其添加为 Hadoop 的附加数据目录。但使用 RAID 0 或 10 配置似乎可以提高一些额外的性能。由于耐用性由 HDFS 本​​身处理,因此无需从该角度考虑 RAID 1 或 5(例如:如果实例上的一个或所有存储发生故障,则耐用性由来自其他数据节点的复制提供)。RAID 6 似乎不切实际,因为已知重建时间长和 2x 奇偶校验写入导致的吞吐量性能降低(再次,让 HDFS 处理耐用性似乎是最好的)。剩下的 R...

Admin

Amazon AWS 临时磁盘和 RAID1
amazon-ephemeral

Amazon AWS 临时磁盘和 RAID1

一些 AWS 实例附加了“临时磁盘”,速度比 EBS 快得多。但是,当您的实例停止并启动时,临时磁盘将为空白且未初始化。不过,磁盘上的数据通常会在实例重启后保留下来。 问题:我是否应该在我的 AWS 实例上使用基于临时磁盘和 EBS 卷构建的软件 RAID1? 我的想法是,raid1 将以降级模式启动,仅包含 EBS 卷,然后我们可以使用 mdadm 命令将空白临时磁盘重新添加到 raid 中。这将使应用程序启动时间提前 5-10 分钟,但代价是 raid1 同步时性能较差。 背景:我有一个应用程序使用约 40 GB 的数据文件。访问时间与性能...

Admin