我的根服务器和性能下降的 RAID 出了点问题。不幸的是,我不是 RAID 方面的专家。
系统信息:Debian 7.5,SSD 软件 RAID1,问题出现已有几天了。
请查看我可以从命令行获取的以下信息:
=======================================================================
# cat /proc/mdstat
Personalities : [raid1]
md2 : active raid1 sda3[0]
216994240 blocks super 1.2 [2/1] [U_]
md1 : active raid1 sda2[0]
523968 blocks super 1.2 [2/1] [U_]
md0 : active (auto-read-only) raid1 sda1[0]
16768896 blocks super 1.2 [2/1] [U_]
unused devices: <none>
# mdadm -D /dev/md0
/dev/md0:
Version : 1.2
Creation Time : Tue Jan 7 09:39:23 2014
Raid Level : raid1
Array Size : 16768896 (15.99 GiB 17.17 GB)
Used Dev Size : 16768896 (15.99 GiB 17.17 GB)
Raid Devices : 2
Total Devices : 1
Persistence : Superblock is persistent
Update Time : Tue Jan 7 10:00:27 2014
State : clean, degraded
Active Devices : 1
Working Devices : 1
Failed Devices : 0
Spare Devices : 0
Name : rescue:0
UUID : 7bda6bfa:f532c676:88921937:c40e5b60
Events : 19
Number Major Minor RaidDevice State
0 8 1 0 active sync /dev/sda1
1 0 0 1 removed
# mdadm -D /dev/md1
/dev/md1:
Version : 1.2
Creation Time : Tue Jan 7 09:39:23 2014
Raid Level : raid1
Array Size : 523968 (511.77 MiB 536.54 MB)
Used Dev Size : 523968 (511.77 MiB 536.54 MB)
Raid Devices : 2
Total Devices : 1
Persistence : Superblock is persistent
Update Time : Mon Jun 9 18:02:08 2014
State : clean, degraded
Active Devices : 1
Working Devices : 1
Failed Devices : 0
Spare Devices : 0
Name : rescue:1
UUID : a34a400c:6e44aebb:e6bd697f:832bebe3
Events : 106
Number Major Minor RaidDevice State
0 8 2 0 active sync /dev/sda2
1 0 0 1 removed
# mdadm -D /dev/md2
/dev/md2:
Version : 1.2
Creation Time : Tue Jan 7 09:39:23 2014
Raid Level : raid1
Array Size : 216994240 (206.94 GiB 222.20 GB)
Used Dev Size : 216994240 (206.94 GiB 222.20 GB)
Raid Devices : 2
Total Devices : 1
Persistence : Superblock is persistent
Update Time : Tue Jun 10 11:01:58 2014
State : clean, degraded
Active Devices : 1
Working Devices : 1
Failed Devices : 0
Spare Devices : 0
Name : rescue:2
UUID : fda00d92:d41a6e34:9fcc87f9:29ef44be
Events : 255477
Number Major Minor RaidDevice State
0 8 3 0 active sync /dev/sda3
1 0 0 1 removed
=======================================================================
在我看来,RAID 丢失了部分驱动器?(或全部驱动器!!!)我怎样才能让这个 RAID 再次正常工作?我与服务器有 SSH 根连接。
提前致谢。chriskapeller
答案1
您说得没错。服务器丢失了一个驱动器(可能是 /dev/sdb)。您总共有 3 个 raid 设备 /dev/md0、/dev/md1、/dev/md2(我猜它们是用于 /、/boot 和 swap)
您需要执行以下操作:
- 验证磁盘是否确实发生故障
dmesg
可以提供帮助(并让您感到困惑)。 - 要求提供商物理更换故障驱动器
- 之后重新组建突袭队
raid 重组的过程如下(假设磁盘为 /dev/sda 和 /dev/sdb):
- 从现有磁盘复制磁盘分区
dd if=/dev/sda of=/dev/sdb bs=1M count=1
- 修复分区
cfdisk /dev/sdb
基本上写入分区 将相应碎片添加到破损的数组中:
mdadm /dev/md0 -add /dev/sda1
mdadm /dev/md1 -add /dev/sda2
mdadm /dev/md2 -add /dev/sda3
强制文件系统检查
fsck
您可以在以下地方找到更多信息:
https://raid.wiki.kernel.org/index.php/Recovering_a_failed_software_RAID