RAID6 无法挂载 EXT4-fs：几何结构错误：块计数超出设备大小

Question

您的 ext4 文件系统比您的块设备（12TB 块设备上的 54TB 文件系统）大得多。e2fsck并且resize2fs在这种情况下可能会非常不合作。文件系统讨厌大块丢失。

debugfs为了快速恢复数据，您可以在灾难模式下试试运气：

# debugfs -c /dev/md127
debugfs 1.47.0 (5-Feb-2023)
debugfs: ls -l
| (this should list some files)
| (damaged files usually show with 0 bytes and 1-Jan-1970 timestamp)
debugfs: rdump / /some/recovery/dir/

这应该复制文件（使用不相关的 HDD 进行恢复存储），但某些文件可能会导致类似Attempt to read block from filesystem resulted in short read或类似的错误。

为了真正修复文件系统，通常最好恢复原始设备大小，然后从那里开始。有时，缩小块设备是可逆的。但就你的情况而言，这是不可逆的。

您可以将 RAID 增加到 11 个设备，但即使驱动器顺序正确，它也不会恢复任何丢失的数据，甚至会覆盖剩余磁盘上可能留下的任何数据。 mdadm 在每个增长操作中都会移动偏移量，因此布局会完全错误。

因此，超出截止点的任何内容都会丢失。

此外，（再次）重塑所有这些数据将需要很长时间，而且结果不会比仅仅增加一些虚拟驱动器容量（循环设备和 dm-线性、或 LVM 精简卷或类似的全为零）更好。

最好的情况是，您可以通过重新创建来部分逆转它（在写时复制覆盖上使用 mdadm --create ）您原来的 11 个驱动器 RAID 6 缺少 4 个驱动器（因为驱动器完全归零）。

但至多这会给您带来断开连接的数据块，并且它们之间有许多间隙，因为这超出了 RAID 6 可以恢复的范围。它甚至更加复杂，因为您不再拥有元数据（需要知道原始偏移量，该偏移量已经在当前的 raid 上更改，以及驱动器顺序）。

如果您能做到这一点，您可以将当前的 RAID (0-12TB) 和恢复的 raid (12TB-54TB) 与 dm-线性拼接在一起（全部位于写时复制覆盖层之上），然后看看可以找到什么。

但这个过程比较复杂，成功的概率也很低。对于存储在收缩操作保留的 12TB 之外的任何数据，一些小于块/条带文件的数据可能会幸存，而较大的文件将全部损坏。

Answer 1