如何检查 LSI RAID 上的 UBad 磁盘是否真的发生故障

如何检查 LSI RAID 上的 UBad 磁盘是否真的发生故障

我已接手一台配有 LSI RAID 卡的新服务器,该服务器配置了 4 个驱动器(在 R10 中)和一个备用驱动器。我通常通过关闭服务器并通过 LSI GUI (rom) 配置来管理 RAID 阵列。

但是,我目前无法关闭此服务器,因此我安装了 LSI CIM(在 ESXi 6.7 上)。storcli 命令显示以下内容:

----------------------------------------------------------------------------------
EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                  Sp Type
----------------------------------------------------------------------------------
252:0     3 Onln   0 5.457 TB SATA HDD N   N  512B WDC WD6002FRYZ-01WD5B1 U  -
252:1     5 Onln   0 5.457 TB SATA HDD N   N  512B WDC WD6002FRYZ-01WD5B1 U  -
252:2     6 Onln   0 5.457 TB SATA HDD N   N  512B WDC WD6002FRYZ-01WD5B1 U  -
252:3     7 Onln   0 5.457 TB SATA HDD N   N  512B WDC WD6002FRYZ-01WD5B1 U  -
252:4     4 UBad   F 5.457 TB SATA HDD N   N  512B WDC WD6002FRYZ-0       U  -
----------------------------------------------------------------------------------

如您所见,插槽 4 中的磁盘标记为“UBad”。但是,这真的意味着它发生故障吗?它显示为旋转(Sp:U)。DG(驱动器组)显示为“F”——不知道这是什么意思。可能是驱动器没有配置为热备用?

我还能从命令行执行其他什么操作来查看发生了什么?有没有办法从通过 IP 连接到主机的 GUI(在 Linux 中,或第二选择 Windows 中)来管理它?

更新:

我按照下面的建议在驱动器上使用了“set good”参数,以及“/fall delete”,它不再显示为外部配置:

----------------------------------------------------------------------------------
EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                  Sp Type
----------------------------------------------------------------------------------
252:0     3 Onln   0 5.457 TB SATA HDD N   N  512B WDC WD6002FRYZ-01WD5B1 U  -
252:1     5 Onln   0 5.457 TB SATA HDD N   N  512B WDC WD6002FRYZ-01WD5B1 U  -
252:2     6 Onln   0 5.457 TB SATA HDD N   N  512B WDC WD6002FRYZ-01WD5B1 U  -
252:3     7 Onln   0 5.457 TB SATA HDD N   N  512B WDC WD6002FRYZ-01WD5B1 U  -
252:4     4 UGood  - 5.457 TB SATA HDD N   N  512B WDC WD6002FRYZ-01WD5B1 U  -
----------------------------------------------------------------------------------

注意现在出现了完整的型号……很奇怪。这是不是意味着有些东西不可靠?

答案1

F可能代表“外部”——该磁盘是否在另一台服务器上使用?

磁盘型号未正确报告(WD6002FRYZ-0??????)这一事实令人怀疑,但如果不考虑 SMART 属性,就很难判断磁盘是否真的损坏。

您应该能够UGood使用set good命令将其设置为,使用清除外部配置delete并将其重新添加到阵列。如果磁盘确实只连接到此服务器,delete您可以尝试使用import(在这种情况下,最好先使用import preview)。

这里这里您可以找到类似的参考资料,但由于您正在生产系统上工作,请务必了解这些命令将在您的系统上执行的操作发行其中任何一个。任何错误都可能导致数据丢失,因此,如果您没有最近的工作备份,请在此处停止。

相关内容