我有一台带有此卡的 Dell PowerEdge 2950:RAID 总线控制器 [0104]:Dell PowerEdge 可扩展 RAID 控制器 5 [1028:0015] 和 RAID-10 中的六个磁盘。
我更换了驱动器 2,因为它没有出现,然后它开始重建:
root@backup01:~# megaraidsas-status
-- Arrays informations --
-- ID | Type | Size | Status
a0d0 | RAID 10 | 5587GiB | DEGRADED
-- Disks informations
-- ID | Model | Status | Warnings
a0e8s0 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5393
a0e8s1 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5394
a0e8s2 | ATA ST2000DM001-1E61 1863GiB | rebuild | errs: media:0 other:99
a0e8s3 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5393
a0e8s4 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5393
a0e8s5 | ATA ST2000DM001-9YN1 1863GiB | online | errs: media:0 other:5393
重建完成后,虚拟驱动器将达到最佳状态,驱动器 2 上线。然后每天一次,驱动器 2 就像被移除一样,重建重新开始。如何停止每天一次的重建?
Event Description: Removed: PD 02(e1/s2)
Event Description: Removed: PD 02(e1/s2) Info: enclPd=08, scsiType=0, portMap=04, sasAddr=1221000002000000,0000000000000000
Event Description: State change on VD 00/0 from OPTIMAL(3) to DEGRADED(2)
Event Description: VD 00/0 is now DEGRADED1
Event Description: State change on PD 02(e1/s2) from ONLINE(18) to FAILED(11)
Event Description: State change on PD 02(e1/s2) from FAILED(11) to UNCONFIGURED_BAD(1)
Event Description: Background Initialization failed on VD 00/0
Event Description: Inserted: PD 02(e1/s2)
Event Description: Inserted: PD 02(e1/s2) Info: enclPd=08, scsiType=0, portMap=04, sasAddr=1221000002000000,0000000000000000
Event Description: PD 02(e1/s2) is not a certified drive
Event Description: State change on PD 02(e1/s2)
Event Description: State change on PD 02(e1/s2) from UNCONFIGURED_GOOD(0) to OFFLINE(10) from UNCONFIGURED_BAD(1) to UNCONFIGURED_GOOD(0)
Event Description: Rebuild automatically started on PD 02(e1/s2)
Event Description: State change on PD 02(e1/s2) from OFFLINE(10) to REBUILD(14)
答案1
先给你一个初步的了解。在我看来,这听起来像是双重数据故障/穿孔,这意味着你有坏块,这些坏块在 RAID 中传播。根据我的经验,这可能会导致一些非常非常奇怪的问题。你可以在这里阅读:http://www.dell.com/support/Article/us/en/04/438291/en
我们能否获得您的 RAID 控制器日志的输出?您是否安装了 dell open manage server 管理员软件包?如果没有,那么这是最好的起点。看起来您正在运行某种版本的 Linux,您可以下载 OMSA 软件包:http://linux.dell.com/repo/hardware/omsa.html。
打开管理后,您可以使用以下命令导出 RAID 控制器日志:omconfig storage controller action=exportlog controller=id,其中 controller 是控制器的 ID(除非您有多个 RAID 控制器,否则应为 0)。一旦我们有了该输出,我们就可以确认发生了什么。(希望如此)。
最后还有一件事,您的可扩展 RAID 5,您知道那是 PERC5i、SAS5 还是其他型号?
希望可以帮到你!