HP EVA 4000 上的备用级别

HP EVA 4000 上的备用级别

今天我们的 EVA4000 的一个磁盘坏了。这个磁盘组(所有卷都是 vraid5,备用级别为 1,几乎没有剩余空间用于更多卷,1TiB 驱动器)现在正在使用“备用空间”重建,并且至少需要 15 个小时才能完成调平/重建。

我们要到星期五才能拿到新磁盘。所以,问题是,如果在升级完成之前另一个磁盘坏了会发生什么?我们会丢失数据吗?在那之后,在丢失数据之前,还有多少个磁盘会坏掉?1 个还是 2 个?

在“通常”的 RAID 中,重建时我们很容易丢失数据,但在这种情况下,保留用于备用的空间是两次更大磁盘的大小,因此至少其效果应该与拥有两个备用磁盘相同。

提前致谢。

更新:我发现了一些关于这个问题的有趣的帖子,但仍然无法回答这个问题,所以我开始悬赏。

http://blog.thestoragearchitect.com/2008/10/27/understanding-eva/

http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&url=http%3A%2F%2Fwww.experts-exchange.com%2FStorage%2FStorage_Technology%2FQ_25548177.html(来自谷歌的专家交流问题)。

答案1

简洁版本

调平是一个过程重建。如果您的阵列正在升级,那么您的安全性与磁盘发生故障之前一样。

长版本

当您丢失磁盘时,EVA 将自动尝试使用剩余健康磁盘上的任何空间来创建该磁盘上曾经存在的数据的冗余副本。如果您有一个卷组,其中包含一个具有 Vraid5 奇偶校验的大型虚拟磁盘,并且您丢失了一个磁盘,EVA 将在第一个磁盘的可用空间上重新生成故障磁盘上曾经存在的数据。如果空间不足,它将使用 2、3 个或更多磁盘,但您将在最短的时间内获得数据的冗余副本。这需要多长时间,我无法告诉您。但您将在很短的时间内回到“您可以丢失磁盘而不会丢失数据”的状态。当然,前提是您的磁盘中有足够的可用空间。

你提到了备用。我不熟悉这个术语,但我希望你谈论的是“故障保护级别”,这是舱外活动将要进行的空间 预订以应对您所描述的紧急情况。单一保护级别意味着它将保留两个最大磁盘的大小,以及四块磁盘的两倍大小。EVA 不会将此空间报告为可用空间。因此,如果您使用单一保护级别,并且使用 16 个 1TB 磁盘的 95%,则您将保留 2TB,并且仅使用剩余 14TB 的 95%。也就是说使用了 13.3TB,还有 2.7TB 可用。如果将 Vraid5 考虑在内,则有 10.64TB 可用空间和 2.66TB 浪费用于奇偶校验。

一旦 EVA 在尽可能少的磁盘上创建了冗余副本,它就会开始平衡数据(我个人更喜欢称之为“平衡”)。此过程涉及移动数据,以便最终所有磁盘的数据量大致相同。此过程需要很长时间,特别是如果您的使用率很高,但如果此时再次发生故障,您就安全了。

进入命令视图并检查卷组的状态。如果它显示正在平衡 - 您与故障前一样安全。

现在,您的原始磁盘空间已降至 15TB,而您使用了 13.3TB。EVA 希望保持单一保护级别,但它无法保留 2TB(您只有 1.7TB 未使用),因此它可能正在报告请求 保护级别为单身的,以及实际的保护级别为 没有任何。它还可能会报告您的使用量超过 100%,因为您使用了 13.3TB,而为了满足单一保护要求,您的使用量应低于 13TB(总共 15TB - 为单一保护保留 2TB)。

这仍然意味着您仍然可以丢失另一个磁盘,并且您仍然拥有健康的存储空间。您可能会丢失第二个磁盘,而 Vraid5 冗余将保护您的数据(尽管您可能会看到性能下降)。当然,如果您很幸运,您可能会幸免于第三和第四个磁盘故障,只要它们不在同一个 Vraid 条带中(EVA 的 Vraid5 更像是 RAID5+0,条带跨越 5 个磁盘)。

更新:与您的问题无关,但最新的FATA 固件更新有“修复在极少数情况下可能发生的自启动重置”。相信我,看到磁盘毫无理由地被扔出卷组的感觉并不好。

更新 2:更新是因为单一保护级别意味着 磁盘。

答案2

我的 MSA 4400 也有过类似的经历。我们让它以 95% 的容量运行,但它每个月都会发生大约 9 次驱动器故障,所以我对数据丢失灾难的惨痛经历有些熟悉。

您有几层暂存空间可以防止您丢失数据,很难判断您目前处于哪一层。显然,备用空间是其中很重要的一个。此外,您使用的 vraid 级别也会发挥作用。此外,即使您更换了该驱动器,它也必须再次重建。

您需要注意的主要事情是池上的故障保护级别。您可以设置请求的级别(如双倍),然后将其与实际级别(如单倍或无)进行比较。也就是说,即使您在单个驱动器故障中从双倍变为无(我最讨厌这个盒子的事情之一是它允许这样做),您仍然有几种方法可以让阵列使用 vraid 或其他黑魔法的奇偶校验来防止您丢失数据。

答案3

对于 HP EVA:
级别 1 = 配置的两个最大驱动器的容量保留用于备用

这意味着如果您丢失了 2 个磁盘,您将没有备用磁盘,只能依靠 RAID5 奇偶校验。在当前情况下,您可以丢失 1 个磁盘而不会导致阵列降级,还可以丢失 2 个磁盘而不会丢失数据,但性能会下降。在我们的组织中,我们始终在机柜外放置 2 个备用磁盘,并保持相同的温度(因此插入前无需回火)。

相关内容