在两个控制器的数据库均已损坏后从 Dell MD3220 阵列恢复数据

在两个控制器的数据库均已损坏后从 Dell MD3220 阵列恢复数据

我一直在尝试从在 Dell MD3220 PowerVault 存储单元上创建的阵列中恢复数据。几个星期以来,我一直在与 Dell 和另一个支持小组通电话,但一直无果。我希望这里有人能给我一个想法,让我可以尝试一下,希望能够恢复数据。存储设备有 24 个驱动器托架,以 0 为基数(因此驱动器 24 称为 23,驱动器 1 称为 0)。

MD3220 正面MD3220 返回

该设备断电了,我猜想存储设备在两台服务器访问数据(通过 SAS 电缆)之前离线是导致问题的原因。因此,位于 MD3220 中每个控制器(有两个)上的包含阵列配置的数据库已损坏。

  • 我们尝试用控制器上找到的最新备份替换当前数据库来恢复数据库(常见情况)。但似乎失败了。

  • 我们甚至尝试使用我用来管理设备的服务器上存储的文件 (DBM 文件) 重建数据库。我们让戴尔生成一个验证器密钥,用于重建数据库。这似乎也失败了。

我不断看到但无法解决的错误是Exception type N3adp6Device24ExtentAllocatedExceptionE message "N3adp6Device24ExtentAllocatedExceptionE"with extent:553 of size:1106 for drive ordinal22

09/29/21-19:24:37 (tRAID): WARN:  UWManager::initializeNvsramIWLog: IWLog invalidated
09/29/21-19:24:37 (tRAID): NOTE:  UWMgr findIWLogs: Found IW log drive. Devnum 0x10001 tray=0 slot=2 ssd=0 qos=3 controller=0
09/29/21-19:24:37 (tRAID): NOTE:  UWMgr findIWLogs: Found IW log drive. Devnum 0x10002 tray=0 slot=3 ssd=0 qos=3 controller=0
09/29/21-19:24:37 (IWTask): NOTE:  UWMgr: IW logging started
09/29/21-19:24:41 (tRAID): ERROR: CrushDrive::allocateExtent - Exception type N3adp6Device24ExtentAllocatedExceptionE message "N3adp6Device24ExtentAllocatedExceptionE"with extent:553 of size:1106 for drive ordinal22
09/29/21-19:24:41 (tRAID): ERROR: CrushStripe DeSerialization - Couldn't allocate extent! CrushDrive 22 Volume 1 CrushPiece 2 Extent 553
09/29/21-19:24:41 (tRAID): ERROR: Exception during stripe allocation in vdm::CrushStripePersistenceManager::initialize(1)
09/29/21-19:24:41 (tRAID): ERROR: vdm::CrushInvalidCfgMgr DB_CORRUPT detected
09/29/21-19:24:41 (tRAID): NOTE:  lockdownPrimaryDBInvalidWorker: OBB already in pcache, not updating.
09/29/21-19:24:41 (tRAID): WARN:  BackupDatabaseManager:lockdownPrimaryDBInvalid Exception IconSendInfeasibleException Error
09/29/21-19:24:41 (tRAID): WARN:  BDBM:  Client detected Primary DB Corruption. Forcing dualControllerLockdown.
09/29/21-19:24:41 (tRAID): WARN:  Ctl Reboot:
                                Reboot CompID: 0x407
                                Reboot reason: 0x11
                                Reboot reason extra: 0x2
09/29/21-19:24:41 (tRAID): WARN:  Rebooting this Controller now

我猜“序数 22”指的是驱动器 23(总共 24 个驱动器)?但不确定它在抱怨什么。驱动器 23 坏了吗?所有驱动器上都有数据库,而驱动器 23 上的数据库坏了吗?有没有办法恢复该驱动器的数据库,比如从另一个驱动器复制数据库等?它甚至在谈论驱动器 23 吗?任何人能给我提供任何帮助都会很有帮助。

谢谢!!

相关内容