我有一个 RAID1 阵列,其中一个磁盘轻微损坏/dev/sdb
。我将一个新的硬盘放入/dev/sda
该阵列中以进行镜像sdb
(然后我将更换sdb
为新的硬盘)。
# cat /proc/mdstat
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md0 : active raid1 sda2[2] sdb2[1]
999872 blocks super 1.2 [2/2] [UU]
md1 : active raid1 sda3[2] sdb3[1]
1952380736 blocks super 1.2 [2/1] [_U]
[>....................] recovery = 2.7% (53083136/1952380736) finish=640.0min speed=49453K/sec
unused devices: <none>
但这个“恢复”过程在 30% 左右就停止了:
# cat /proc/mdstat
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md0 : active raid1 sda2[2] sdb2[1]
999872 blocks super 1.2 [2/2] [UU]
md1 : active raid1 sda3[2](S) sdb3[1]
1952380736 blocks super 1.2 [2/1] [_U]
unused devices: <none>
我猜这里的问题是/dev/sdb
有大约 100 个坏块(用 发现badblocks -v -b 512 /dev/sdb > sdb-bads.log
)。无法从它们读取/写入:
# tail -n 2 sdb-bads.log
1039341414
1039341415
# dd if=/dev/sdb of=/dev/null bs=512 skip=1039341414 count=1
dd: error reading '/dev/sdb': Input/output error
0+0 records in
0+0 records out
0 bytes copied, 9.33531 s, 0.0 kB/s
# dd if=/dev/sdb of=/dev/null bs=512 skip=1039341415 count=1
dd: error reading '/dev/sdb': Input/output error
0+0 records in
0+0 records out
0 bytes copied, 3.36192 s, 0.0 kB/s
我的问题是:
- 是否有可能找出哪些文件受到影响(假设 RAID1)?据我了解,工具喜欢
debugfs
使用物理文件系统,而不是虚拟 RAID。 - 是否有机会在
sda
同步期间跳过这些块(假设我可以丢失一些数据)以完成 RAID1 镜像过程?
答案1
最后我不得不badblocks -v -b 512 /dev/sdb > sdb-bads.log
用hdparm --write-sector
.我丢失了一些数据,但是至少现在我可以更换sdb
新的 HDD,并从sda
.