我创建了 raid 10,我从 md11 中逐一删除了两个阵列,之后我要编辑已安装的内容(它将处于无响应阶段),在我尝试删除剩余的阵列后,它显示设备或资源繁忙(未从内存中删除)。我尝试终止进程,这也不起作用,我吸收了 4 天的重新同步将是 8.0%,它无法修改。
#cat /proc/mdstat
Personalities : [raid1] [raid0] [raid6] [raid5] [raid4] [linear] [raid10] md11 : active raid10 sde1[3] sdj14 286743936 blocks 64K chunks 2 near-copies [4/1] [___U] [1:2:3:0] [=>...................] resync = 8.0% (23210368/286743936) finish=289392.6min speed=15K/sec
#mdadm -D /dev/md11
/dev/md11: Version : 00.90.03 Creation Time : Sun Jan 16 16:20:01 2011 Raid Level : raid10 Array Size : 286743936 (273.46 GiB 293.63 GB) Device Size : 143371968 (136.73 GiB 146.81 GB) Raid Devices : 4 Total Devices : 2 Preferred Minor : 11 Persistence : Superblock is persistent
Update Time : Sun Jan 16 16:56:07 2011
State : active, degraded, resyncing
Active Devices : 1 Working Devices : 1 Failed Devices : 1 Spare Devices : 0
Layout : near=2, far=1
Chunk Size : 64K
Rebuild Status : 8% complete
UUID : 5e124ea4:79a01181:dc4110d3:a48576ea
Events : 0.23
Number Major Minor RaidDevice State
0 0 0 0 removed
1 0 0 1 removed
4 8 145 2 faulty spare rebuilding /dev/sdj1
3 8 65 3 active sync /dev/sde1
#umount /dev/md11
umount: /dev/md11: not mounted
#mdadm -S /dev/md11
mdadm: fail to stop array /dev/md11: Device or resource busy
#lsof /dev/md11
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME mount 2128 root 3r BLK 9,11 4058 /dev/md11 mount 5018 root 3r BLK 9,11 4058 /dev/md11 mdadm 27605 root 3r BLK 9,11 4058 /dev/md11 mount 30562 root 3r BLK 9,11 4058 /dev/md11 badblocks 30591 root 3r BLK 9,11 4058 /dev/md11
#kill -9 2128
#kill -9 5018
#kill -9 27605
#kill -9 30562
#kill -3 30591
#mdadm -S /dev/md11
mdadm: fail to stop array /dev/md11: Device or resource busy
#lsof /dev/md11
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME mount 2128 root 3r BLK 9,11 4058 /dev/md11 mount 5018 root 3r BLK 9,11 4058 /dev/md11 mdadm 27605 root 3r BLK 9,11 4058 /dev/md11 mount 30562 root 3r BLK 9,11 4058 /dev/md11 badblocks 30591 root 3r BLK 9,11 4058 /dev/md11
#cat /proc/mdstat
Personalities : [raid1] [raid0] [raid6] [raid5] [raid4] [linear] [raid10] md11 : active raid10 sde1[3] sdj14 286743936 blocks 64K chunks 2 near-copies [4/1] [___U] [1:2:3:0] [=>...................] resync = 8.0% (23210368/286743936) finish=289392.6min speed=15K/sec
答案1
因此,看起来您一开始就有 5 个磁盘,但我没有看到列表中的数字“2”磁盘,而您需要 4 个磁盘才能创建 RAID 10
Number Major Minor RaidDevice State
0 0 0 0 removed
1 0 0 1 removed
4 8 145 2 faulty spare rebuilding /dev/sdj1
3 8 65 3 active sync /dev/sde1
并且定义了一个自动启动的备用磁盘。问题是,阵列中没有足够的磁盘来完全重建它。
我很少使用 RAID 10,但是从外观来看...
- 您一开始有 5 个磁盘,其中 1 个定义为备用磁盘
- 1 名成员退出,可能你并不知情
- 热备用已启动并开始重建
- 又拉出了 2 个磁盘
您需要至少 4 个磁盘才能使 RAID 10 正常运行,您只有两个磁盘,再添加两个磁盘,希望您的同步计会开始上升。此外,您无法终止这些进程,它们正在执行 IO 并且不可中断,您必须让它们自行完成或放弃。
提示:下次您想要练习这种故障注入时,请使用 VM 来熟悉,只需创建一堆微型 vdisk 即可。