mdadm 在启动时将错误的设备放入阵列中 更正 mdadm.conf 文件

mdadm 在启动时将错误的设备放入阵列中 更正 mdadm.conf 文件

每次启动时它都会出错:

    [root][centos ~] cat /proc/mdstat 
Personalities : [raid6] [raid5] [raid4] 
md127 : inactive sda[2] sdb[3]
      1953524992 blocks
unused devices: <none>
[root][centos ~] mdadm --stop /dev/md127 
mdadm: stopped /dev/md127
[root][centos ~] mdadm --assemble --scan
mdadm: /dev/md0 has been started with 4 drives.
[root][centos ~] cat /proc/mdstat 
Personalities : [raid6] [raid5] [raid4] 
md0 : active raid5 sda1[0] sdd1[3] sdc1[2] sdb1[1]
      2930279424 blocks level 5, 1024k chunk, algorithm 2 [4/4] [UUUU]          
unused devices: <none>

您可以看到,它首先检测到 BS md127,然后我必须停止它,然后重新组装它,这里有一个奇怪的事情,它检测到两个 md0,但它成功了:

[root][centos ~] mdadm -Es 
ARRAY /dev/md0 UUID=39c28990:e753d835:8b94c90b:72da1a08
ARRAY /dev/md0 UUID=88edc937:2ecbc9bb:8b94c90b:72da1a08

我的 mdadm.conf

[root][centos ~] cat /etc/mdadm.conf
DEVICE partitions 
ARRAY /dev/md0 UUID=88edc937:2ecbc9bb:8b94c90b:72da1a08
MAILADDR root 
CREATE owner=root group=disk mode=0660 auto=yes
HOMEHOST <system>

但最奇怪的是,在 dmesg 中,我认为问题出在这里:

md: kicking non-fresh sdc from array!
md: unbind<sdc>
md: export_rdev(sdc)
md: kicking non-fresh sdd from array!
md: unbind<sdd>
md: export_rdev(sdd)
async_tx: api initialized (async)
xor: automatically using best checksumming function: generic_sse
   generic_sse:  6532.000 MB/sec
xor: using function: generic_sse (6532.000 MB/sec)
raid6: int64x1   1664 MB/s
raid6: int64x2   2148 MB/s
raid6: int64x4   1453 MB/s
raid6: int64x8   1457 MB/s
raid6: sse2x1    2417 MB/s
raid6: sse2x2    3222 MB/s
raid6: sse2x4    3429 MB/s
raid6: using algorithm sse2x4 (3429 MB/s)
md: raid6 personality registered for level 6
md: raid5 personality registered for level 5
md: raid4 personality registered for level 4
raid5: device sda operational as raid disk 2
raid5: device sdb operational as raid disk 3
raid5: allocated 4282kB for md127
2: w=1 pa=0 pr=4 m=1 a=2 r=4 op1=0 op2=0
3: w=2 pa=0 pr=4 m=1 a=2 r=4 op1=0 op2=0
raid5: not enough operational devices for md127 (2/4 failed)
RAID5 conf printout:
 --- rd:4 wd:2
 disk 2, o:1, dev:sda
 disk 3, o:1, dev:sdb
raid5: failed to run raid set md127
md: pers->run() failed ...

答案1

您可能需要重建您的initrd,以便它具有正确的mdadm.conf文件,因为启动过程必须使用该版本,直到它可以挂载根文件系统。

你需要做的是这样的:

mkinitrd /boot/initrd-<kernel-version>.img <kernel-version>

我在这里假设您使用的 CentOS 版本仍在使用mkinitrd- 如果已切换,dracut那么您将需要:

dracut /boot/initramfs-<kernel-version>.img <kernel-version>

无论哪种情况,您都需要先重命名旧文件,然后才能创建新文件。

答案2

mdadm 应该能够组装 md 设备。它似乎看到了一些错误的驱动器:

md127 :非活动 sda[2] sdb[3]

看起来它正在将整个 sda 和 sdb 磁盘用于 raid 阵列,而不是分区 sda1 sdb1 sdc1 sdd1。

blkid 显示什么?mdadm -E /dev/sda 或 mdadm -E /dev/sdb 显示什么?

也许超级街区发生了一些奇怪的事情。

正如 TomH 所说,您也应该尝试重建 initrd。

答案3

在 Ubuntu 中我使用以下命令解决了这个问题:

sudo update-initramfs -k all -u

答案4

我想我找到了它,这是由于我的 mdadm.conf 文件不够具体并且可能会让操作系统感到困惑。

因此我读了以下文章:http://manpages.ubuntu.com/manpages/hardy/man5/mdadm.conf.5.html

我发现如果我用这个

DEVICE partitions

然后:

这将导致 mdadm 读取 /proc/partitions 并包含在其中找到的所有设备和分区

所以我把它改成了

DEVICE /dev/sd[abcd]1

相关内容