欢迎。
我尝试从 Linux 软件 RAID 故障中恢复。我正在根据系统健康时的 syslog 重新创建超级块。日志提到了 2 个 md 设备,每个设备基于 5 个 500GB 分区。RAID-5 /dev/md5 由 /dev/sd[bf]6 组成,RAID-6 /dev/md6 由 /dev/sd[bf]5 组成。相关部分 dmesg 日志如下所示:
[ 5.964928] raid5: allocated 5265kB for md5
[ 5.979771] 4: w=1 pa=0 pr=5 m=1 a=2 r=5 op1=0 op2=0
[ 5.987064] 1: w=2 pa=0 pr=5 m=1 a=2 r=5 op1=0 op2=0
[ 5.994256] 3: w=3 pa=0 pr=5 m=1 a=2 r=5 op1=0 op2=0
[ 6.001441] 2: w=4 pa=0 pr=5 m=1 a=2 r=5 op1=0 op2=0
[ 6.008665] 0: w=5 pa=0 pr=5 m=1 a=2 r=5 op1=0 op2=0
[ 6.015883] raid5: raid level 5 set md5 active with 5 out of 5 devices, algorithm 2
[ 6.031441] RAID5 conf printout:
[ 6.039266] --- rd:5 wd:5
[ 6.046856] disk 0, o:1, dev:sdb6
[ 6.054308] disk 1, o:1, dev:sdf6
[ 6.061524] disk 2, o:1, dev:sdc6
[ 6.068667] disk 3, o:1, dev:sde6
[ 6.075774] disk 4, o:1, dev:sdd6
[ 6.089504] md5: bitmap initialized from disk: read 1/1 pages, set 0 bits
[ 6.096768] created bitmap (15 pages) for device md5
[ 6.141010] md5: detected capacity change from 0 to 1978409418752
[ 6.153794] md5: unknown partition table
[ 5.594614] raid5: device sde5 operational as raid disk 3
[ 5.599701] raid5: device sdd5 operational as raid disk 4
[ 5.604750] raid5: device sdf5 operational as raid disk 1
[ 5.609879] raid5: device sdc5 operational as raid disk 2
[ 5.615032] raid5: device sdb5 operational as raid disk 0
[ 5.621672] raid5: allocated 5265kB for md6
[ 5.627243] 3: w=1 pa=0 pr=5 m=2 a=2 r=5 op1=0 op2=0
[ 5.632846] 4: w=2 pa=0 pr=5 m=2 a=2 r=5 op1=0 op2=0
[ 5.638502] 1: w=3 pa=0 pr=5 m=2 a=2 r=5 op1=0 op2=0
[ 5.644155] 2: w=4 pa=0 pr=5 m=2 a=2 r=5 op1=0 op2=0
[ 5.649844] 0: w=5 pa=0 pr=5 m=2 a=2 r=5 op1=0 op2=0
[ 5.655566] raid5: raid level 6 set md6 active with 5 out of 5 devices, algorithm 2
[ 5.667653] RAID5 conf printout:
[ 5.673791] --- rd:5 wd:5
[ 5.679837] disk 0, o:1, dev:sdb5
[ 5.685721] disk 1, o:1, dev:sdf5
[ 5.691570] disk 2, o:1, dev:sdc5
[ 5.697348] disk 3, o:1, dev:sde5
[ 5.703122] disk 4, o:1, dev:sdd5
[ 5.710762] md6: bitmap initialized from disk: read 1/1 pages, set 0 bits
[ 5.716915] created bitmap (15 pages) for device md6
- 这一行上的数字
[ 5.979771] 4: w=1 pa=0 pr=5 m=1 a=2 r=5 op1=0 op2=0
(包括第一个)代表什么意思4:
? - 线上的数字
[ 6.039266] --- rd:5 wd:5]
代表什么意思? - 线上的数字
[ 6.046856] disk 0, o:1, dev:sdb6
代表什么意思? - 该行是否
[ 6.096768] created bitmap (15 pages) for device md5
说明了位图的位置、位置和大小?
答案1
在邮件交流后[电子邮件保护]邮件列表,我收到了罗宾希尔先生的以下答复:
问题 1:
4 是 raid 设备编号
w=1 表示目前找到的工作磁盘数量
pa=0 是前一个算法(重塑时使用)
pr=5 是之前的 raid 设备数量(重塑时使用)
m=1 是阵列运行允许的最大降级磁盘数
a=2 是使用的算法
r=5 是 raid 设备的数量
op1=0 表示该磁盘在之前的布局中不是仅奇偶校验磁盘(重塑时使用)
op2=0 表示该磁盘在当前布局中不是仅奇偶校验磁盘
问题2:
- rd 是阵列中的设备数量
- wd 是阵列中工作设备的数量
问题 3:
- 0 是 raid 设备编号
- o:1 表示它可以运行(即未标记为故障)
- dev:sdb6表示内核设备名
问题 4:
它没有告诉你有关这个地方的任何信息。不过我不知道页面数量如何等于位图大小/位图块大小。
在上述情况下,RAID 设备编号是其在阵列中的位置,因此对于 N 设备阵列,其编号从 0 到 N-1。这将指示您在重新创建阵列时需要使用的顺序。