我有一台 HP ProLiant DL380 Gen7,配备智能阵列 P812,连接到装有 19 个 600GB 驱动器的 MSA20。
在我的虚拟机无法启动后,我检查了阵列配置,发现有 2 个驱动器出现故障:
=> ctrl slot=1 logicaldrive 1 show
Smart Array P812 in Slot 1
array A
Logical Drive: 1
Size: 7.6 TB
Fault Tolerance: 60
Number of Parity Groups: 2
Heads: 255
Sectors Per Track: 32
Cylinders: 65535
Strip Size: 256 KB
Full Stripe Size: 1792 KB
Status: Failed
MultiDomain Status: OK
Caching: Enabled
Unique Identifier: 600508B1001CB429B3CE88E8CD6573D5
Logical Drive Label: 025B181CPAGXQ0ARH0J02057B0
Parity Group 0:
physicaldrive 1E:1:1 (port 1E:box 1:bay 1, SAS, 600 GB, OK)
physicaldrive 1E:1:2 (port 1E:box 1:bay 2, SAS, 0 MB, Failed)
physicaldrive 1E:1:6 (port 1E:box 1:bay 6, SAS, 600 GB, OK)
physicaldrive 1E:1:7 (port 1E:box 1:bay 7, SAS, 0 MB, Failed)
physicaldrive 1E:1:8 (port 1E:box 1:bay 8, SAS, 600 GB, OK)
physicaldrive 1E:1:9 (port 1E:box 1:bay 9, SAS, 600 GB, OK)
physicaldrive 1E:1:10 (port 1E:box 1:bay 10, SAS, 600 GB, OK)
physicaldrive 1E:1:11 (port 1E:box 1:bay 11, SAS, 600 GB, OK)
physicaldrive 1E:1:24 (port 1E:box 1:bay 24, SAS, 600 GB, OK)
Parity Group 1:
physicaldrive 1E:1:12 (port 1E:box 1:bay 12, SAS, 600 GB, OK)
physicaldrive 1E:1:13 (port 1E:box 1:bay 13, SAS, 600 GB, OK)
physicaldrive 1E:1:14 (port 1E:box 1:bay 14, SAS, 600 GB, Predictive Failure)
physicaldrive 1E:1:15 (port 1E:box 1:bay 15, SAS, 600 GB, OK)
physicaldrive 1E:1:16 (port 1E:box 1:bay 16, SAS, 600 GB, OK)
physicaldrive 1E:1:17 (port 1E:box 1:bay 17, SAS, 600 GB, OK)
physicaldrive 1E:1:18 (port 1E:box 1:bay 18, SAS, 600 GB, OK)
physicaldrive 1E:1:19 (port 1E:box 1:bay 19, SAS, 600 GB, OK)
physicaldrive 1E:1:20 (port 1E:box 1:bay 20, SAS, 600 GB, OK)
Drive Type: Data
LD Acceleration Method: Controller Cache
因此,我的 19 个驱动器(18 个 + 1 个备用)中,有 2 个突然出现故障。
我对 RAID 60 的理解是,每个奇偶校验组有 2 个驱动器可以发生故障但不会丢失数据。
我能否以某种方式强制阵列联机以将文件复制到其他驱动器?
提前感谢您的帮助,我知道我的装备很古老。
编辑:这是 MSA70,而不是 MSA20!
答案1
最有可能的是奇偶校验组 0 中的某些驱动器发生故障,控制器已开始使用备用驱动器进行重建。重建期间,另一个驱动器(或多个驱动器)发生故障,这种情况出现过几次。
如果您没有一些日志或监控数据(例如,如果您仅在启动问题后查看控制器状态),则很难准确说出发生了什么。您可以查看 ctrl slot=1 pd all show
您很可能会看到备用磁盘故障。如果没有备份,您很可能无法恢复数据。