RAID1恢复过程跳过坏块

2024-6-4 • tag-icon

我有一个 RAID1 阵列，其中一个磁盘轻微损坏/dev/sdb。我将一个新的硬盘放入/dev/sda该阵列中以进行镜像sdb（然后我将更换sdb为新的硬盘）。

# cat /proc/mdstat
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10] 
md0 : active raid1 sda2[2] sdb2[1]
      999872 blocks super 1.2 [2/2] [UU]

md1 : active raid1 sda3[2] sdb3[1]
      1952380736 blocks super 1.2 [2/1] [_U]
      [>....................]  recovery =  2.7% (53083136/1952380736) finish=640.0min speed=49453K/sec

unused devices: <none>

但这个“恢复”过程在 30% 左右就停止了：

# cat /proc/mdstat 
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10] 
md0 : active raid1 sda2[2] sdb2[1]
      999872 blocks super 1.2 [2/2] [UU]

md1 : active raid1 sda3[2](S) sdb3[1]
      1952380736 blocks super 1.2 [2/1] [_U]

unused devices: <none>

我猜这里的问题是/dev/sdb有大约 100 个坏块（用发现badblocks -v -b 512 /dev/sdb > sdb-bads.log）。无法从它们读取/写入：

# tail -n 2 sdb-bads.log
1039341414
1039341415

# dd if=/dev/sdb of=/dev/null bs=512 skip=1039341414 count=1
dd: error reading '/dev/sdb': Input/output error
0+0 records in
0+0 records out
0 bytes copied, 9.33531 s, 0.0 kB/s

# dd if=/dev/sdb of=/dev/null bs=512 skip=1039341415 count=1
dd: error reading '/dev/sdb': Input/output error
0+0 records in
0+0 records out
0 bytes copied, 3.36192 s, 0.0 kB/s

我的问题是：

是否有可能找出哪些文件受到影响（假设 RAID1）？据我了解，工具喜欢debugfs使用物理文件系统，而不是虚拟 RAID。
是否有机会在sda同步期间跳过这些块（假设我可以丢失一些数据）以完成 RAID1 镜像过程？

答案1

最后我不得不badblocks -v -b 512 /dev/sdb > sdb-bads.log用hdparm --write-sector.我丢失了一些数据，但是至少现在我可以更换sdb新的 HDD，并从sda.

答案1

相关内容