mdadm raid1,[1/2] 磁盘发生故障,可以安全重启吗?

mdadm raid1,[1/2] 磁盘发生故障,可以安全重启吗?

我在 /proc/mdstat 下看到以下内容

Personalities : [raid1]
md1 : active raid1 sda2[0](F) sdb2[1]
976554876 blocks super 1.1 [2/1] [_U]
bitmap: 4/8 pages [16KB], 65536KB chunk

md0 : active raid1 sda1[0](F) sdb1[1]
204788 blocks super 1.0 [2/1] [_U]

unused devices: <none>

看起来 /dev/sda 已发生故障。但是,raid1 是冗余的,所以我的系统应该仍能运行。然而,事实并非如此,我的整个文件系统已被踢入只读模式。

Running mdadm --detail gives me:
sudo: Can't open /var/run/sudo/supertrader/18: Read-only file system
/dev/md0:
        Version : 1.0
  Creation Time : Tue Aug 16 18:04:44 2011
     Raid Level : raid1
     Array Size : 204788 (200.02 MiB 209.70 MB)
  Used Dev Size : 204788 (200.02 MiB 209.70 MB)
   Raid Devices : 2
  Total Devices : 2
    Persistence : Superblock is persistent

    Update Time : Thu Mar  1 09:48:13 2012
          State : clean, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 1
  Spare Devices : 0

    Number   Major   Minor   RaidDevice State
       0       0        0        0      removed
       1       8       17        1      active sync

       0       8        1        -      faulty spare

此时,我想让机器再次运行(文件系统未锁定在只读模式),同时找数据中心的某个人来更换故障的驱动器。

当我尝试使用以下命令移除故障驱动器时:

      mdadm --manage /dev/md0 --remove /dev/sda2

我收到有关未找到 /dev/sda2 的错误消息。

我的问题如下:(1) 如果我现在重新启动系统,系统会自动启动,而不会出现故障磁盘吗?或者我需要找到某种方法从软件阵列中实际移除磁盘。我不在机器本地,所以如果它在启动时卡住,修复起来真的很麻烦。

提前致谢。

编辑2:我继续重新启动,系统再次启动,这次文件系统已挂载 rw

我不确定发生了什么,但看起来“故障”磁盘又恢复了?这是 /proc/mdstat

Personalities : [raid1]
md1 : active raid1 sdb2[1]
      976554876 blocks super 1.1 [2/1] [_U]
      bitmap: 5/8 pages [20KB], 65536KB chunk

md0 : active raid1 sda1[0] sdb1[1]
      204788 blocks super 1.0 [2/2] [UU]

unused devices: <none>

在此之前,我已经运行过:

mdadm /dev/md0 -r --force detached

我在 md0 和 md1 上都执行了此操作。md0 现在看起来很正常,知道 md1 发生了什么吗?

编辑:此外,我注意到在 /dev/ 下 sda 和 sdb 都丢失了,事实上,我只有 sdc1 和 sdc2。

这是怎么回事?为什么我的两个 RAID 磁盘都丢失了?

fdisk -l 输出:

磁盘 /dev/md0:209 MB,209702912 字节 2 个磁头,4 个扇区/磁道,51197 个磁柱 单位 = 8 个磁柱 * 512 = 4096 字节 扇区大小(逻辑/物理):512 字节 / 512 字节 I/O 大小(最小/最佳):512 字节 / 512 字节 磁盘标识符:0x00000000

Device Boot      Start         End      Blocks   Id  System

磁盘 /dev/md1:1000.0 GB,999992193024 字节 2 个磁头,4 个扇区/磁道,244138719 个磁柱 单位 = 8 个磁柱 * 512 = 4096 字节 扇区大小(逻辑/物理):512 字节 / 512 字节 I/O 大小(最小/最佳):512 字节 / 512 字节 磁盘标识符:0x00000000

磁盘 /dev/md1 不包含有效的分区表

磁盘 /dev/dm-0:27.9 GB,27917287424 字节 255 个磁头,63 个扇区/磁道,3394 个磁柱 单位 = 16065 * 512 = 8225280 字节的磁柱 扇区大小(逻辑/物理):512 字节 / 512 字节 I/O 大小(最小/最佳):512 字节 / 512 字节 磁盘标识符:0x00000000

磁盘 /dev/dm-0 不包含有效的分区表

磁盘 /dev/dm-1:972.1 GB,972071895040 字节 255 个磁头,63 个扇区/磁道,118181 个磁柱 单位 = 16065 * 512 = 8225280 字节的磁柱 扇区大小(逻辑/物理):512 字节 / 512 字节 I/O 大小(最小/最佳):512 字节 / 512 字节 磁盘标识符:0x00000000

磁盘 /dev/dm-1 不包含有效的分区表

磁盘 /dev/sdc:1000.2 GB,1000204886016 字节 255 个磁头,63 个扇区/磁道,121601 个磁柱 单位 = 16065 * 512 = 8225280 字节的磁柱 扇区大小(逻辑/物理):512 字节 / 512 字节 I/O 大小(最小/最佳):512 字节 / 512 字节 磁盘标识符:0x0009984e

设备启动开始结束块 ID 系统 /dev/sdc1 * 1 26 204800 fd Linux raid 自动检测分区 1 未在柱面边界上结束。 /dev/sdc2 26 121602 976556032 fd Linux raid 自动检测

有没有可靠的方法可以找出哪个是我能幸存的磁盘硬件?

相关内容