这是我的问题:
我在 raid10(4 个磁盘)上运行 ubuntu 12.04,在其上我安装了一个带有两个卷组(一个用于 /,一个用于 /home)的 lvm。
磁盘的布局如下:
Disk /dev/sda: 1500.3 GB, 1500301910016 bytes
255 heads, 63 sectors/track, 182401 cylinders, total 2930277168 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x0003f3b6
Device Boot Start End Blocks Id System
/dev/sda1 * 63 481949 240943+ 83 Linux
/dev/sda2 481950 2910640634 1455079342+ fd Linux raid autodetect
/dev/sda3 2910640635 2930272064 9815715 82 Linux swap / Solaris
Disk /dev/sdb: 1500.3 GB, 1500301910016 bytes
255 heads, 63 sectors/track, 182401 cylinders, total 2930277168 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00069785
Device Boot Start End Blocks Id System
/dev/sdb1 63 2910158684 1455079311 fd Linux raid autodetect
/dev/sdb2 2910158685 2930272064 10056690 82 Linux swap / Solaris
Disk /dev/sdc: 1500.3 GB, 1500301910016 bytes
255 heads, 63 sectors/track, 182401 cylinders, total 2930277168 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00000000
Device Boot Start End Blocks Id System
/dev/sdc1 63 2910158684 1455079311 fd Linux raid autodetect
/dev/sdc2 2910158685 2930272064 10056690 82 Linux swap / Solaris
Disk /dev/sdd: 1500.3 GB, 1500301910016 bytes
255 heads, 63 sectors/track, 182401 cylinders, total 2930277168 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x000f14de
Device Boot Start End Blocks Id System
/dev/sdd1 63 2910158684 1455079311 fd Linux raid autodetect
/dev/sdd2 2910158685 2930272064 10056690 82 Linux swap / Solaris
第一个磁盘(/dev/sda)包含 /dev/sda1 上的 /boot 分区。我使用 grub2 从此分区启动系统。
在这个 raid10 上我安装了两个卷组,一个用于 /,一个用于 /home。
这个系统运行良好,过去两年我甚至更换了两个磁盘。它一直都运行良好。但这次不行。
第一次,/dev/sda 坏了。我不知道这是否是个问题——我知道无论如何我都会努力克服安装在该磁盘上的 /boot 和安装在 /dev/sda 的 mbr 上的 grub2 的问题。
无论如何,我做了我一直在做的事情:
- 启动 knoppix
发起突袭
sudo mdadm --examine -scan
返回
ARRAY /dev/md127 UUID=0dbf4558:1a943464:132783e8:19cdff95
启动它
sudo mdadm --assemble /dev/md127
使故障磁盘失效(智能事件)
sudo mdadm /dev/md127 --fail /dev/sda2
删除故障磁盘
sudo mdadm /dev/md127 --remove /dev/sda2
停止突袭
sudo mdadm -S /dev/md127
- 取出磁盘
- 更换新的
- 创建与故障分区相同的分区
将其添加到突袭中
sudo mdadm --assemble /dev/md127 sudo mdadm /dev/md127 --add /dev/sda2
- 等待4小时
一切看起来都很好:
cat /proc/mdstat
返回:
Personalities : [raid10]
md127 : active raid10 sda2[0] sdd1[3] sdc1[2] sdb1[1]
2910158464 blocks 64K chunks 2 near-copies [4/4] [UUUU]
unused devices: <none>
和
sudo mdadm --detail /dev/md127
返回
/dev/md127:
Version : 0.90
Creation Time : Wed Jun 10 13:08:46 2009
Raid Level : raid10
Array Size : 2910158464 (2775.34 GiB 2980.00 GB)
Used Dev Size : 1455079232 (1387.67 GiB 1490.00 GB)
Raid Devices : 4
Total Devices : 4
Preferred Minor : 127
Persistence : Superblock is persistent
Update Time : Thu Mar 21 16:27:40 2013
State : clean
Active Devices : 4
Working Devices : 4
Failed Devices : 0
Spare Devices : 0
Layout : near=2
Chunk Size : 64K
UUID : 0dbf4558:1a943464:132783e8:19cdff95 (local to host Microknoppix)
Events : 0.4824680
Number Major Minor RaidDevice State
0 8 2 0 active sync /dev/sda2
1 8 17 1 active sync /dev/sdb1
2 8 33 2 active sync /dev/sdc1
3 8 49 3 active sync /dev/sdd1
但是,没有卷组的踪迹。重新启动进入 knoppix 也无济于事。重新启动旧系统(我实际上为此重新插入并重新添加了故障磁盘 - 系统开始启动,但随后无法看到 / 分区 - 难怪卷组消失了)也无济于事。
sudo vgscan
,,,,全部 返回。sudo vgdisplay
sudo lvs
sudo lvdisplay
sudo vgscan –mknodes
No volume groups found
我完全不知所措。有人能告诉我是否可以恢复我的数据以及如何恢复吗?
提前致谢!