更换服务器中 8 个驱动器中的 3 个

更换服务器中 8 个驱动器中的 3 个

我们有一台运行 SQL 2008 R2 的 Dell R510 服务器,配备 8 x 300GB 驱动器,运行 Raid 5。

我们(刚刚注意到)有三个驱动器出现故障并且指示灯闪烁,因此我们关闭了服务器并用新的驱动器替换它们。

当服务器重新启动时,灯光呈绿色(但不闪烁)。

服务器仅显示 XXXX GB 的空间,因此它没有读取驱动器,我们是否错过了使新驱动器上线的步骤?

构建 raid 阵列是否需要时间,还是我们应该一次交换一个?

我们有数据的副本,因此恢复它不是什么大问题。

答案1

你为什么要在网上询问这个问题?

有很多什么鬼这里,我不明白从哪里开始!!

这个问题表明对硬件、RAID 阵列、存储、监控和一般 IT 最佳实践缺乏根本的了解。

看到这个问题,我不禁想到:

  • 谁实际负责该服务器硬件?系统管理员/顾问/IT 专业人员在哪里?

  • 为什么要关闭服务器来更换硬件 RAID 阵列中的热插拔磁盘?这样做没有必要,而且如果您已经怀疑磁盘有问题,这会大大增加风险。

  • 您明白“闪烁的灯”是什么意思吗?灯是什么颜色的?也许它们表示磁盘预故障,而不是完全故障。

  • 您更换了驱动器,却不知道这样做会产生什么影响。这些操作只会让情况变得更糟,而且您可能已经毁掉了数据。

  • 为什么在更换驱动器后,磁盘阵列的大小会发生变化?“XXXX GB”到底是什么意思?为什么它与您的问题有关?如何传达磁盘容量和类型以及呈现给操作系统的阵列大小等详细信息?

  • 刚刚注意到磁盘故障?您有备用磁盘,但没有监控来实际识别故障?您的服务器监控应该告诉您这一点。即使是对服务器进行基本的目视检查也有助于识别问题。我怀疑磁盘是否同时发生故障。

  • 有人检查过系统日志吗?启动系统时硬件 RAID 控制器说了什么?Dell DRAC 日志说了什么?操作系统说了什么?

  • 最后,如果你对你的制造商支持,品牌硬件,并且不明白发生了什么,评估你的情况(检查日志、数据和备份)不是更有意义吗?联系戴尔

我理解消费化技术意味着人们经常被赋予责任并处于他们无法胜任的境地,但这里所展现的基本故障排除技能的缺乏令人震惊。不幸的是,人们提供这种级别的服务却能得到报酬。

答案2

使用 RAID 5,您只能丢失 1 个磁盘,并且数据仍然可用。您已经丢失了 3 个磁盘,因此您需要重建 RAID,然后从备份中恢复数据。

我们有一个关于的经典问答RAID 级别这可能有助于你的理解。

相关内容