RAID10 阵列降级了?

RAID10 阵列降级了?

今天早些时候,我收到了一封来自mdadm 监控内容如下:

This is an automatically generated mail message from mdadm
running on server

This is an automatically generated mail message from mdadm
running on server

A Fail event had been detected on md device /dev/md127.

It could be related to component device /dev/sdd1.

Faithfully yours, etc.

P.S. The /proc/mdstat file currently contains the following:

Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md127 : active raid10 sda1[0] sdc1[2] sdd1[3](F) sdb1[1]
  5860267008 blocks super 1.2 512K chunks 2 near-copies [4/3] [UUU_]
  [==========>..........]  check = 50.9% (2983082496/5860267008) finish=1025.1min speed=46774K/sec

unused devices: <none>

我刚刚登录服务器并运行cat /proc/mdstat,结果如下:

Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md127 : active raid10 sda1[0] sdb1[1] sdc1[2]
      5860267008 blocks super 1.2 512K chunks 2 near-copies [4/3] [UUU_]

unused devices: <none>

我理解得对吗?驱动器出现故障了吗?

答案1

您有 512E 磁盘sdd。这意味着您可能遇到一些未知问题,例如旧 BIOS、旧 SATA 控制器或旧 OS 驱动程序。此磁盘的 SMART 数据显示运行状况良好。sdd磁盘很好!

为什么被标记为失败?我认为有很多原因:

  1. 功率更低。只需安装新的更高功率的供电装置即可。此磁盘在高负载下最多可消耗 20W 的功率。

  2. 禁用服务器电源管理。也对您的磁盘执行此操作。或设置最大性能。禁用 OS 电源服务,例如powerdcpuspeed等。

  3. 旧的 SATA 控制器在高负载下可能会工作不正常。尝试更新 BIOS。如果这没有帮助,请安装新的 SATA 控制器(可正确支持4K磁盘512E)或更换主板。

另一种方法 - 仅使用512n旧型号的磁盘。它们的容量高达 4Tb。

答案2

是的,sdd1 失败了。

摘自原始电子邮件

md127 :活动 raid10 sda1[0] sdc1[2]sdd1[3](女)sdb1[1] 5860267008 块 超级 1.2 512K 块 2 个近副本[4/3][呜呜呜]

从你的观察来看

md127 : 活动 raid10 sda1[0] sdb1[1] sdc1[2] 5860267008 块超级 1.2 512K 块 2 个近副本[4/3][呜呜呜]

理想情况下,您的阵列应该有 4 个设备,但实际上只有 3 个。

相关内容