我在 /proc/mdstat 下看到以下内容
Personalities : [raid1]
md1 : active raid1 sda2[0](F) sdb2[1]
976554876 blocks super 1.1 [2/1] [_U]
bitmap: 4/8 pages [16KB], 65536KB chunk
md0 : active raid1 sda1[0](F) sdb1[1]
204788 blocks super 1.0 [2/1] [_U]
unused devices: <none>
看起来 /dev/sda 已发生故障。但是,raid1 是冗余的,所以我的系统应该仍能运行。然而,事实并非如此,我的整个文件系统已被踢入只读模式。
Running mdadm --detail gives me:
sudo: Can't open /var/run/sudo/supertrader/18: Read-only file system
/dev/md0:
Version : 1.0
Creation Time : Tue Aug 16 18:04:44 2011
Raid Level : raid1
Array Size : 204788 (200.02 MiB 209.70 MB)
Used Dev Size : 204788 (200.02 MiB 209.70 MB)
Raid Devices : 2
Total Devices : 2
Persistence : Superblock is persistent
Update Time : Thu Mar 1 09:48:13 2012
State : clean, degraded
Active Devices : 1
Working Devices : 1
Failed Devices : 1
Spare Devices : 0
Number Major Minor RaidDevice State
0 0 0 0 removed
1 8 17 1 active sync
0 8 1 - faulty spare
此时,我想让机器再次运行(文件系统未锁定在只读模式),同时找数据中心的某个人来更换故障的驱动器。
当我尝试使用以下命令移除故障驱动器时:
mdadm --manage /dev/md0 --remove /dev/sda2
我收到有关未找到 /dev/sda2 的错误消息。
我的问题如下:(1) 如果我现在重新启动系统,系统会自动启动,而不会出现故障磁盘吗?或者我需要找到某种方法从软件阵列中实际移除磁盘。我不在机器本地,所以如果它在启动时卡住,修复起来真的很麻烦。
提前致谢。
编辑2:我继续重新启动,系统再次启动,这次文件系统已挂载 rw
我不确定发生了什么,但看起来“故障”磁盘又恢复了?这是 /proc/mdstat
Personalities : [raid1]
md1 : active raid1 sdb2[1]
976554876 blocks super 1.1 [2/1] [_U]
bitmap: 5/8 pages [20KB], 65536KB chunk
md0 : active raid1 sda1[0] sdb1[1]
204788 blocks super 1.0 [2/2] [UU]
unused devices: <none>
在此之前,我已经运行过:
mdadm /dev/md0 -r --force detached
我在 md0 和 md1 上都执行了此操作。md0 现在看起来很正常,知道 md1 发生了什么吗?
编辑:此外,我注意到在 /dev/ 下 sda 和 sdb 都丢失了,事实上,我只有 sdc1 和 sdc2。
这是怎么回事?为什么我的两个 RAID 磁盘都丢失了?
fdisk -l 输出:
磁盘 /dev/md0:209 MB,209702912 字节 2 个磁头,4 个扇区/磁道,51197 个磁柱 单位 = 8 个磁柱 * 512 = 4096 字节 扇区大小(逻辑/物理):512 字节 / 512 字节 I/O 大小(最小/最佳):512 字节 / 512 字节 磁盘标识符:0x00000000
Device Boot Start End Blocks Id System
磁盘 /dev/md1:1000.0 GB,999992193024 字节 2 个磁头,4 个扇区/磁道,244138719 个磁柱 单位 = 8 个磁柱 * 512 = 4096 字节 扇区大小(逻辑/物理):512 字节 / 512 字节 I/O 大小(最小/最佳):512 字节 / 512 字节 磁盘标识符:0x00000000
磁盘 /dev/md1 不包含有效的分区表
磁盘 /dev/dm-0:27.9 GB,27917287424 字节 255 个磁头,63 个扇区/磁道,3394 个磁柱 单位 = 16065 * 512 = 8225280 字节的磁柱 扇区大小(逻辑/物理):512 字节 / 512 字节 I/O 大小(最小/最佳):512 字节 / 512 字节 磁盘标识符:0x00000000
磁盘 /dev/dm-0 不包含有效的分区表
磁盘 /dev/dm-1:972.1 GB,972071895040 字节 255 个磁头,63 个扇区/磁道,118181 个磁柱 单位 = 16065 * 512 = 8225280 字节的磁柱 扇区大小(逻辑/物理):512 字节 / 512 字节 I/O 大小(最小/最佳):512 字节 / 512 字节 磁盘标识符:0x00000000
磁盘 /dev/dm-1 不包含有效的分区表
磁盘 /dev/sdc:1000.2 GB,1000204886016 字节 255 个磁头,63 个扇区/磁道,121601 个磁柱 单位 = 16065 * 512 = 8225280 字节的磁柱 扇区大小(逻辑/物理):512 字节 / 512 字节 I/O 大小(最小/最佳):512 字节 / 512 字节 磁盘标识符:0x0009984e
设备启动开始结束块 ID 系统 /dev/sdc1 * 1 26 204800 fd Linux raid 自动检测分区 1 未在柱面边界上结束。 /dev/sdc2 26 121602 976556032 fd Linux raid 自动检测
有没有可靠的方法可以找出哪个是我能幸存的磁盘硬件?