为 RAID5 故障做准备

为 RAID5 故障做准备

我有一个 Ubuntu 系统,里面有一堆硬盘,用作我的家庭路由器、DHCP 服务器、文件服务器等。在过去的 24 小时内,它两次突然决定将根文件系统设置为只读。我认为其中一个驱动器出现硬件故障。为了安全起见,我订购了一个新驱动器。

Jul  8 07:40:54 monolith kernel: [   42.851001] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
Jul  8 07:40:54 monolith kernel: [   42.851047] ata3.00: BMDMA stat 0x24
Jul  8 07:40:54 monolith kernel: [   42.851089] ata3.00: cmd c8/00:08:67:6a:00/00:00:00:00:00/e0 tag 0 dma 4096 in
Jul  8 07:40:54 monolith kernel: [   42.851134] ata3.00: status: { DRDY ERR }
Jul  8 07:40:54 monolith kernel: [   42.851173] ata3.00: error: { UNC }

我的主要问题是:您认为这是否表示硬盘即将出现故障?我查看了 smartctl,但不太确定我在寻找什么。

另外,有没有办法找出 /dev/sd* ata3 对应哪一个?

/proc/mdstat 说:

Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
md0 : active raid5 sda3[0] sdf1[5] sde1[4] sdd1[3] sdc1[2] sdb1[1]
      4877654400 blocks level 5, 128k chunk, algorithm 2 [6/6] [UUUUUU]

unused devices: <none>

我认为它看起来不错。

如果您处于我的位置,面临 RAID 可能出现故障,您会怎么做?

答案1

使用 RAID5 时,需要具备一些空闲的磁盘,当一个驱动器发生故障时准备启动,但是。

在一个具有多个磁盘同时运行的系统中,当第一个磁盘崩溃时,第二个磁盘很有可能在很短的时间间隔内发生故障!

当 RAID 5 上的某个驱动器发生故障时,其他驱动器必须更加努力地恢复丢失的数据。因此,在重建过程中,整个磁盘组的工作非常困难,并且在这一圈中再次发生崩溃的可能性很高!

所以请及时备份!

甚至在安装新磁盘之前!

记住

即使在降级模式下进行了充分测试,但一旦投入生产,降级的 raid5 阵列在很大程度上意味着系统速度变慢。

相关内容