我有一台 Supermicro 服务器,里面有一个 LSI MegaRAID SAS 9261-8i Raid 控制器。控制器上连接了 3 个磁盘,配置为 RAID5 阵列。其中一个磁盘最近出现故障(RAID 显示为降级),检查 SMART 信息后发现必须更换。
我使用 storcli 将驱动器标记为丢失,然后移除驱动器以将其运送给供应商。现在磁盘的替换件到了,我将其插入 RAID 控制器,但什么也没发生。storcli 的内容如下:
storcli /c0 show
TOPOLOGY :
========
------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type State BT Size PDC PI SED DS3 FSpace
------------------------------------------------------------------------
0 - - - - RAID5 Dgrd N 5.456 TB dflt N N none Y
0 0 - - - RAID5 Dgrd N 5.456 TB dflt N N none Y
0 0 0 - - DRIVE Msng - 2.728 TB - - - - -
0 0 1 252:5 14 DRIVE Onln N 2.728 TB dflt N N none -
0 0 2 252:2 11 DRIVE Onln N 2.728 TB dflt N N none -
------------------------------------------------------------------------
如您所见,插槽 2 和 5 中的两个驱动器均处于在线状态,而设备组 (DG) 中的另一个驱动器被标记为丢失。第三个驱动器曾经位于插槽 0 中,而替换驱动器现在位于插槽 1 中。但控制器无法识别新驱动器,正如您在物理设备列表中看到的那样(来自与上述相同命令的输出):
Physical Drives = 2
PD LIST :
=======
-----------------------------------------------------------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp
-----------------------------------------------------------------------------
252:2 11 Onln 0 2.728 TB SATA HDD N N 512B WDC WD3000FYYZ-01UL1B0 U
252:5 14 Onln 0 2.728 TB SATA HDD N N 512B WDC WD3000FYYZ-01UL1B0 U
-----------------------------------------------------------------------------
与此相反,请参见以下输出:
storcli /c0/pall show
PhyInfo :
=======
----------------------------------------------------------------------------
PhyNo SAS_Addr Phy_Identifier Link_Speed Device_Type Description
----------------------------------------------------------------------------
0 0x0000000000000000 0 No limit - -
1 0x4433221101000000 0 No limit End Device -
2 0x0000000000000000 0 No limit - -
3 0x0000000000000000 0 No limit - -
4 0x4433221104000000 0 No limit End Device -
5 0x0000000000000000 0 No limit - -
6 0x4433221106000000 0 No limit End Device -
7 0x0000000000000000 0 No limit - -
----------------------------------------------------------------------------
我猜那PhyNo 1
是被替换的驱动器,但这是我能找到它踪迹的唯一命令。所有特定于插槽的命令都以Slot 1
结尾Drive not found
。
对此有什么想法吗?我在第二个服务器中测试了更换的驱动器,该服务器具有完全相同的设置(也是相同的 RAID 控制器),控制器立即检测到标记为 的驱动器,这意味着UGood
,Unconfigured Good
因此不可能是驱动器错误。我还进行了一些重新启动,关机几分钟,并尝试在启动时使用 LSI MegaRaid BIOS 来检测新驱动器,但没有成功。驱动器未显示在 LSI MegaRaid BIOS 启动消息中。
如能得到任何提示我将非常感激。
答案1
事实证明,这种行为是由硬盘不足- 也就是被替换的那个。我没有收到它,因为第二台服务器毫无问题地识别了新的硬盘,但也许这是这块新硬盘的最后一口气了。
我没想到到货缺陷通过数据中心级 HDD(WD RE 系列,在您询问之前),我将在将来意识到这一点,以免浪费我的时间。
答案2
我今天在 9361-8i 上遇到了类似的问题。现有 6 个磁盘,具有 Raid6,当我添加两个相同的新磁盘时,它只能识别其中一个。就是不能同时识别两个新磁盘。然后,我切换端口,使新磁盘位于最后一个插槽号(port0-3 和 port0-2),重新启动,它就可以正常工作了!我不知道为什么,但新磁盘似乎被最后一个插槽中的 raid 控制器识别。因此,您不能将新磁盘放在插槽 1 中,将旧磁盘放在插槽 2 中,然后 raid 控制器只会识别旧磁盘。