我最近遇到了 RAID1 卷故障。它包含三个主分区,所有分区都参与独立但配置相似的 VG。这种配置源于这样一个事实:该机器已经有十年的历史了,已经从多个单磁盘升级到带有阵列的多个 VG。
我更换了磁盘,创建了分区并使用 mdadm 将它们添加回 RAID 阵列。这对 md0 和 md1 有效,但对 md2 失败了两次。这是最大的卷,它会失败且不会出现错误,并保持以下状态:
# mdadm --examine /dev/sdc3
/dev/sdc3:
Magic : a92b4efc
Version : 0.90.00
UUID : <omitted>
Creation Time : Wed Nov 3 10:56:13 2010
Raid Level : raid1
Used Dev Size : 1914417728 (1825.73 GiB 1960.36 GB)
Array Size : 1914417728 (1825.73 GiB 1960.36 GB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 2
Update Time : Tue Oct 21 12:25:59 2014
State : clean
Active Devices : 1
Working Devices : 2
Failed Devices : 1
Spare Devices : 1
Checksum : 5d247e27 - correct
Events : 188268
Number Major Minor RaidDevice State
this 2 8 35 2 spare /dev/sdc3
0 0 8 3 0 active sync /dev/sda3
1 1 0 0 1 faulty removed
2 2 8 35 2 spare /dev/sdc3
如果RAID 1阵列只有一个工作磁盘,如何获得备用磁盘?
不过,这个问题也存在一些真正的问题:
- 旧磁盘有 512 字节物理扇区,新磁盘有 4096 字节物理扇区
- 旧磁盘有传统的 MBR 分区,新磁盘有 GPT 分区
- 旧磁盘为 2TB,新磁盘为 3TB。
3TB 的计划是最终取代另一个 2TB 磁盘并扩展阵列,但目前,它是未使用的空间。
笔记:
Old configuration: RAID1, 1x2TB disk, 512 byte physical sectors, MBR from 2010
1x2TB disk, 512 byte physical sectors, MBR from 2010 (failed)
New configuration: RAID1, 1x2TB disk, 512 byte physical sectors, MBR from 2010
1x3TB disk, 4096 byte physical sectors, GPT brand new
2TB磁盘是2010年购买的,已经用了很长时间了。一个失败了,所以我用一个3TB的磁盘替换了它。 GPT 和物理分区的事情可能会转移注意力。只是提一下以防万一它对任何人来说都很重要。
系统日志中出现一些消息,
Oct 21 18:02:58 blacktower kernel: [169469.308398] mdadm: sending ioctl 800c0910 to a partition!
Oct 21 18:02:58 blacktower kernel: [169469.308402] mdadm: sending ioctl 800c0910 to a partition!
Oct 21 18:03:54 blacktower kernel: [169525.933975] mdadm: sending ioctl 1261 to a partition!
Oct 21 18:03:54 blacktower kernel: [169525.933978] mdadm: sending ioctl 1261 to a partition!
Oct 21 18:03:54 blacktower kernel: [169525.934250] mdadm: sending ioctl 1261 to a partition!
Oct 21 18:03:54 blacktower kernel: [169525.934253] mdadm: sending ioctl 1261 to a partition!
该线程表明它是无害的,http://www.spinics.net/lists/raid/msg44887.html
可能不相关,但内核版本可能存在问题。我正在使用 Squeeze LTS。
# uname -r
2.6.32-5-686
唔..
答案1
您没有额外的备用磁盘,一旦阵列出现故障,故障磁盘就会被归类为“潜在”备用磁盘。输出有点令人困惑,但阵列中有 2 个设备:
Raid Devices : 2
Total Devices : 2
Preferred Minor : 2
1 已失败,1 仍处于活动状态:
Active Devices : 1
Working Devices : 2
Failed Devices : 1
Spare Devices : 1
基本上,失败的设备会被计算两次。当 HDD 处于这种状态时,我通常会对其进行故障处理,然后将其移除。
$ sudo mdadm /dev/md0 -f /dev/sdc3
$ sudo mdadm /dev/md0 -r /dev/sdc3
通常,当设备开始出现故障时,您有时可以离开并执行上述操作,然后将它们重新添加回来:
$ sudo mdadm /dev/md0 -a /dev/sdc3
也许可以延长它们的使用寿命,但这通常是您不想让数据面临风险的时候,您应该计划立即卸下硬盘并更换它。
通常情况下,可以移除 HDD,然后您可以运行诸如HDAT2或者旋晶体看看你是否无法修复它们,此时你可以将它们用于不太重要的事情或回收它们。