作为 Raid0 驱动器一部分的磁盘/EBS 卷突然变得不可读/不可用

作为 Raid0 驱动器一部分的磁盘/EBS 卷突然变得不可读/不可用

我们有 4 x 100gig EBS 卷,用作连接到 Windows2008 R2 数据中心 64 位 Amazon EC2 实例的 raid 0(条带化)驱动器中的动态磁盘。

这一切都运行正常,除了我们在 5 周内遇到过 3 次这种情况,其中一个磁盘突然变得不可读/不可用,并且在磁盘管理器中处于脱机状态,并且您无法使用磁盘管理器将其重新激活到条带驱动器中。

我们似乎能让它重新工作的唯一方法是重新启动 EC2 Windows 实例。一旦重新启动,条带驱动器的所有磁盘/卷都会重新联机。

亚马逊尚未能够回答我们的问题,我想知道是否有其他人遇到过同样的问题或有解决方案?

答案1

如果每次都是同一个磁盘,我可以说我以前也遇到过这个问题。我能说的是,托管该卷的服务器可能速度很慢,或者存在其他问题。您可能想尝试制作第二个 raid0,将所有数据复制到上面,然后破坏第一个。这是蛮力,但很有效。

另一个选项是使用 raid5 重新创建。虽然速度会比较慢,但至少您不会因为丢失单个磁盘而离线,而且在系统仍处于活动状态的情况下使用新卷进行恢复要容易得多(尽管 raid5 已降级)。

我们的解决方案是设置主服务器和辅助服务器,这样如果主服务器出现故障,我们可以进行故障转移。通常,问题系统会在一段时间后自行解决,原来的系统将再次可用。

相关内容