恢复使用完整磁盘构建的mdadm raid1（覆盖分区数据）

2024-6-12 • tag-icon

data-recovery raid luks mdadm raid1

恢复使用完整磁盘构建的mdadm raid1（覆盖分区数据）

在设置我的新 PC 时，我还设置了一个新的 RAID 1，其中包含 2 个驱动器，LUKS 位于顶部。将所有数据复制到其中后，我确保一切都可用，然后粉碎了旧驱动器。

但现在我已经没有RAID了。我发现这很可能是因为我在创建 RAID 时使用完整磁盘而不是使用分区。有什么办法可以恢复RAID并恢复其中的数据吗？我已经保存了用于创建 RAID 的确切命令，但在确定不会不可逆转地搞砸某些事情之前我不想做任何事情。

fdisk -l两个驱动器的输出：

Disk /dev/sdb: 3.64 TiB, 4000787030016 bytes, 7814037168 sectors
Disk model: WDC WD40EFAX-68J
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disklabel type: gpt
Disk identifier: 068E27EE-055B-A24A-B51B-D0B79E3DEA00

Disk /dev/sdc: 2.73 TiB, 3000592982016 bytes, 5860533168 sectors
Disk model: TOSHIBA HDWD130 
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disklabel type: gpt
Disk identifier: F4ADCB83-B715-9B4A-A6A0-96687568611E

RAID 是使用以下命令创建的：

sudo mdadm --create --verbose /dev/md0 --level=1 --raid-devices=2 /dev/sdb /dev/sdc

mdadm --examine两个磁盘的输出相同：

/dev/sdb:
   MBR Magic : aa55
Partition[0] :   4294967295 sectors at            1 (type ee)

/dev/sdc:
   MBR Magic : aa55
Partition[0] :   4294967295 sectors at            1 (type ee)

所以看起来分区数据已被删除，这就是为什么它不再作为 raid 成员可见（类型 fd）。是否可以重写分区数据并重新启动RAID？

我的行mdadm.conf如下：

ARRAY /dev/md0 level=raid1 num-devices=2 metadata=1.2 name=WORKSTATION:0 UUID=fe2547a6:3296c156:303989ac:febb5051 devices=/dev/sdb,/dev/sdc

我是否可以仅用 1 个成员启动 RAID 并以这种方式恢复数据？两个磁盘上的 LUKS 数据头应该相同，对吗？或者我应该在再次覆盖它们之前备份它们？

我非常感谢您的帮助，在失败之前大约有 1500GB 的数据。

PS 我知道这 2 个磁盘的大小不同，它曾经是 2 个 3TB 驱动器，但其中一个出现故障，所以我将其替换为 4TB 驱动器。在此情况发生之前，RAID 已经工作并且完全同步。

答案1

由于RAID 1是一个简单的镜像，因此您可以忽略RAID问题，直接搜索LUKS标头。如果不涉及分区，它应该位于驱动器开头附近的某个位置。可能有几百 MiB 偏移，因为mdadm使用了相当大的数据偏移。

以下命令搜索驱动器的前 1 GiB：

# hexdump -C -n 1G /dev/sdx | grep LUKS
08100000  4c 55 4b 53 ba be 00 02  00 00 00 00 00 00 40 00  |LUKS..........@.|

在此示例中，偏移量 0x8100000 (129 MiB) 处存在潜在的 LUKS 标头。

在此偏移处创建一个（只读）循环设备并查看它是否有效......

# losetup --find --show --read-only --offset $((0x8100000)) /dev/sdx
/dev/loop2
# cryptsetup luksOpen /dev/loop2 lukstest
Enter passphrase:
# mount -o loop,ro /dev/mapper/lukstest /mnt/somewhere

如果有效，您可以尝试在保持数据不变的情况下进行恢复。但无论如何，我建议您先制作完整备份副本。

是否可以重写分区数据并重新启动raid？

理论上，你必须

创建两个循环设备(*)，偏移量1 MiB（未来分区偏移量）
在循环设备上再次运行上面的 hexdump 命令以确定正确的偏移量（与裸驱动器相比应为 -1 MiB），
使用这些循环设备，使用正确的偏移量重新创建 RAID并相应地调整 mdadm.conf，
cryptsetup open突袭，
稍微缩小文件系统，为磁盘末尾的 GPT 备份标头腾出空间，
卸载文件系统（如果已安装），cryptsetup closeluks，mdadm --stopraid，losetup -d分离循环设备，
在两个驱动器上创建偏移量为 1 MiB 的分区

此时，您应该拥有带分区的驱动器、分区上的 raid、raid 上的 luks、luks 内的文件系统。

然而，这是最佳情况，只有当我正确理解你的情况时，它才会这样工作。有很多方法会导致这种情况完全错误。

(*)

使用循环设备进行跳环是必要的，因为您必须先缩小文件系统，然后才能在不损坏设备末尾的情况下创建分区。并且只有当您的 RAID 正在运行时（如果它在两个驱动器上运行并且必须保持一致性），您才能缩小文件系统。

如果您直接创建分区，可能不会发生任何可怕的事情（或者无论如何它已经发生了），但从技术上讲，在这种情况下，这不是从裸磁盘到分区的正确方法。

答案2

解决了！

由frostschutz提供的答案非常有效，我目前正在将所有数据备份到另一个磁盘。

如果您碰巧通过谷歌或其他搜索引擎偶然发现这个问题。尝试使用frostschutz提供的步骤找到LUKS标题，如果你找不到任何东西，最好发布你自己的问题，但这会变得相当困难。

对于在 mdadm raid 中使用完整磁盘，我强烈建议首先创建分区。如果你非常清楚自己在做什么能工作，但如果重复使用磁盘，它可能会在磁盘末尾有一个备份表，根据 UEFI 标准，该备份表将用于覆盖您的“错误”分区表（请参阅关于这HN 文章）

可以使用和的组合来完全清除所有分区信息sgdisk --zap，wipefs -a但不要让自己头痛，也不要犯我犯的同样的错误。

相关内容