HP Smart Array P812 - 为什么我的 Raid 60 消失了?

HP Smart Array P812 - 为什么我的 Raid 60 消失了?

我有一台 HP ProLiant DL380 Gen7,配备智能阵列 P812,连接到装有 19 个 600GB 驱动器的 MSA20。

在我的虚拟机无法启动后,我检查了阵列配置,发现有 2 个驱动器出现故障:

=> ctrl slot=1 logicaldrive 1 show

Smart Array P812 in Slot 1

   array A

      Logical Drive: 1
         Size: 7.6 TB
         Fault Tolerance: 60
         Number of Parity Groups: 2
         Heads: 255
         Sectors Per Track: 32
         Cylinders: 65535
         Strip Size: 256 KB
         Full Stripe Size: 1792 KB
         Status: Failed
         MultiDomain Status: OK
         Caching:  Enabled
         Unique Identifier: 600508B1001CB429B3CE88E8CD6573D5
         Logical Drive Label: 025B181CPAGXQ0ARH0J02057B0
         Parity Group 0:
            physicaldrive 1E:1:1 (port 1E:box 1:bay 1, SAS, 600 GB, OK)
            physicaldrive 1E:1:2 (port 1E:box 1:bay 2, SAS, 0 MB, Failed)
            physicaldrive 1E:1:6 (port 1E:box 1:bay 6, SAS, 600 GB, OK)
            physicaldrive 1E:1:7 (port 1E:box 1:bay 7, SAS, 0 MB, Failed)
            physicaldrive 1E:1:8 (port 1E:box 1:bay 8, SAS, 600 GB, OK)
            physicaldrive 1E:1:9 (port 1E:box 1:bay 9, SAS, 600 GB, OK)
            physicaldrive 1E:1:10 (port 1E:box 1:bay 10, SAS, 600 GB, OK)
            physicaldrive 1E:1:11 (port 1E:box 1:bay 11, SAS, 600 GB, OK)
            physicaldrive 1E:1:24 (port 1E:box 1:bay 24, SAS, 600 GB, OK)
         Parity Group 1:
            physicaldrive 1E:1:12 (port 1E:box 1:bay 12, SAS, 600 GB, OK)
            physicaldrive 1E:1:13 (port 1E:box 1:bay 13, SAS, 600 GB, OK)
            physicaldrive 1E:1:14 (port 1E:box 1:bay 14, SAS, 600 GB, Predictive Failure)
            physicaldrive 1E:1:15 (port 1E:box 1:bay 15, SAS, 600 GB, OK)
            physicaldrive 1E:1:16 (port 1E:box 1:bay 16, SAS, 600 GB, OK)
            physicaldrive 1E:1:17 (port 1E:box 1:bay 17, SAS, 600 GB, OK)
            physicaldrive 1E:1:18 (port 1E:box 1:bay 18, SAS, 600 GB, OK)
            physicaldrive 1E:1:19 (port 1E:box 1:bay 19, SAS, 600 GB, OK)
            physicaldrive 1E:1:20 (port 1E:box 1:bay 20, SAS, 600 GB, OK)
         Drive Type: Data
         LD Acceleration Method: Controller Cache

因此,我的 19 个驱动器(18 个 + 1 个备用)中,有 2 个突然出现故障。

我对 RAID 60 的理解是,每个奇偶校验组有 2 个驱动器可以发生故障但不会丢失数据。

我能否以某种方式强制阵列联机以将文件复制到其他驱动器?

提前感谢您的帮助,我知道我的装备很古老。

编辑:这是 MSA70,而不是 MSA20!

答案1

最有可能的是奇偶校验组 0 中的某些驱动器发生故障,控制器已开始使用备用驱动器进行重建。重建期间,另一个驱动器(或多个驱动器)发生故障,这种情况出现过几次。

如果您没有一些日志或监控数据(例如,如果您仅在启动问题后查看控制器状态),则很难准确说出发生了什么。您可以查看 ctrl slot=1 pd all show

您很可能会看到备用磁盘故障。如果没有备份,您很可能无法恢复数据。

相关内容