2 磁盘 mdadm RAID1 阵列中的“备用”磁盘?

2 磁盘 mdadm RAID1 阵列中的“备用”磁盘?

我最近遇到了 RAID1 卷故障。它包含三个主分区,所有分区都参与独立但配置相似的 VG。这种配置源于这样一个事实:该机器已经有十年的历史了,已经从多个单磁盘升级到带有阵列的多个 VG。

我更换了磁盘,创建了分区并使用 mdadm 将它们添加回 RAID 阵列。这对 md0 和 md1 有效,但对 md2 失败了两次。这是最大的卷,它会失败且不会出现错误,并保持以下状态:

# mdadm --examine /dev/sdc3
/dev/sdc3:
          Magic : a92b4efc
        Version : 0.90.00
           UUID : <omitted>
  Creation Time : Wed Nov  3 10:56:13 2010
     Raid Level : raid1
  Used Dev Size : 1914417728 (1825.73 GiB 1960.36 GB)
     Array Size : 1914417728 (1825.73 GiB 1960.36 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 2

    Update Time : Tue Oct 21 12:25:59 2014
          State : clean
 Active Devices : 1
Working Devices : 2
 Failed Devices : 1
  Spare Devices : 1
       Checksum : 5d247e27 - correct
         Events : 188268


      Number   Major   Minor   RaidDevice State
this     2       8       35        2      spare   /dev/sdc3

   0     0       8        3        0      active sync   /dev/sda3
   1     1       0        0        1      faulty removed
   2     2       8       35        2      spare   /dev/sdc3

如果RAID 1阵列只有一个工作磁盘,如何获得备用磁盘?

不过,这个问题也存在一些真正的问题:

  • 旧磁盘有 512 字节物理扇区,新磁盘有 4096 字节物理扇区
  • 旧磁盘有传统的 MBR 分区,新磁盘有 GPT 分区
  • 旧磁盘为 2TB,新磁盘为 3TB。

3TB 的计划是最终取代另一个 2TB 磁盘并扩展阵列,但目前,它是未使用的空间。


笔记:

Old configuration:  RAID1, 1x2TB disk, 512 byte physical sectors, MBR from 2010
                           1x2TB disk, 512 byte physical sectors, MBR from 2010 (failed)

New configuration:  RAID1, 1x2TB disk, 512 byte physical sectors, MBR from 2010
                           1x3TB disk, 4096 byte physical sectors, GPT brand new

2TB磁盘是2010年购买的,已经用了很长时间了。一个失败了,所以我用一个3TB的磁盘替换了它。 GPT 和物理分区的事情可能会转移注意力。只是提一下以防万一它对任何人来说都很重要。


系统日志中出现一些消息,

Oct 21 18:02:58 blacktower kernel: [169469.308398] mdadm: sending ioctl 800c0910 to a partition!
Oct 21 18:02:58 blacktower kernel: [169469.308402] mdadm: sending ioctl 800c0910 to a partition!
Oct 21 18:03:54 blacktower kernel: [169525.933975] mdadm: sending ioctl 1261 to a partition!
Oct 21 18:03:54 blacktower kernel: [169525.933978] mdadm: sending ioctl 1261 to a partition!
Oct 21 18:03:54 blacktower kernel: [169525.934250] mdadm: sending ioctl 1261 to a partition!
Oct 21 18:03:54 blacktower kernel: [169525.934253] mdadm: sending ioctl 1261 to a partition!

该线程表明它是无害的,http://www.spinics.net/lists/raid/msg44887.html

可能不相关,但内核版本可能存在问题。我正在使用 Squeeze LTS。

# uname -r
2.6.32-5-686

唔..

答案1

您没有额外的备用磁盘,一旦阵列出现故障,故障磁盘就会被归类为“潜在”备用磁盘。输出有点令人困惑,但阵列中有 2 个设备:

   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 2

1 已失败,1 仍处于活动状态:

 Active Devices : 1
Working Devices : 2
 Failed Devices : 1
  Spare Devices : 1

基本上,失败的设备会被计算两次。当 HDD 处于这种状态时,我通常会对其进行故障处理,然后将其移除。

$ sudo mdadm /dev/md0 -f /dev/sdc3
$ sudo mdadm /dev/md0 -r /dev/sdc3

通常,当设备开始出现故障时,您有时可以离开并执行上述操作,然后将它们重新添加回来:

$ sudo mdadm /dev/md0 -a /dev/sdc3

也许可以延长它们的使用寿命,但这通常是您不想让数据面临风险的时候,您应该计划立即卸下硬盘并更换它。

通常情况下,可以移除 HDD,然后您可以运行诸如HDAT2或者旋晶体看看你是否无法修复它们,此时你可以将它们用于不太重要的事情或回收它们。

参考

相关内容