RAID 5 崩溃...试图保存我能保存的东西

Question

几乎不可能真正回答，因为没有人确切知道你之前/之后之间到底发生了什么。请对我下面的推论持保留态度——不可能肯定地说事情是这样发生的，但从你提供的数据来看，情况是这样的。

您的（之前）显示 1 个驱动器完全丢失，另一个驱动器明显过时。（4 月 23 日与 4 月 28 日，事件计数 3515 与 3927）。

你的（之后）一团糟。事件计数重置 (331)，驱动器顺序完全不同（sde3 是 #7，现在是 #0。sdf3 是 #6，现在是 #1。等等），不清楚如何恢复丢失的驱动器和过时的驱动器强行放回阵中。此外，它显示驱动器 #2 正在重建，即使驱动器 #3 丢失且驱动器 #5 已过期。

基本上看起来像是有人重新创建了 RAID，如果操作正确的话可以工作，但是只有当你真正知道自己在做什么但你不知道的时候。除非您能解释驱动器顺序的更改，否则看起来这里做得不正确。

如果这些假设是正确的，那么在您的（之前）状态下，数据恢复的机会仍然很大。即使文件系统本身被攻击，自故障事件（4 月 23 日）以来未修改的任何文件都应该未损坏并且在某种程度上是可恢复的。

随着重新创建重新同步的驱动器和重建的进行，可能会破坏驱动器 #7 和 #2 上的数据，这种恢复的机会现在为零，或者更确切地说减少到小于 chunksize 的文件，在您的情况下恰好是64K。对于代码片段来说已经足够了，但除此之外就没有什么了。

此时可以拯救您的一件事是，如果丢失的驱动器实际上并未发生故障，只是随机踢出，并且在 4 月 23 日之前很久没有踢出。您实际上并未说明该驱动器是否已被物理更换。

如果丢失的驱动器实际上没有缺陷，并且仍然具有有效数据，并且仍在该阵列中旋转，那么即使驱动器顺序错误，重新创建也可能不会造成额外的损坏。由于 XOR 奇偶校验计算的工作方式（任何顺序），这对于 raid5 来说是一个可能的魔术。

Answer 1