当一个驱动器出现硬件故障时,如何处理 Linux 软件 RAID?

当一个驱动器出现硬件故障时,如何处理 Linux 软件 RAID?

我有一台服务器,里面有两个内置硬盘。当其中一个硬盘出现硬件故障时,会发生什么情况?它会向 root 发送电子邮件消息来引起您的注意吗?

当确定一个驱动器损坏并需要更换时,在具有两个驱动器的软件 RAID 设置中该如何工作?您是否只需关闭系统电源,用新驱动器更换损坏的驱动器,然后重新打开系统电源,系统就会自行克隆到新安装的驱动器?

或者这是否需要在完成此操作之前为新硬盘做一些准备工作?如果是这样,需要做什么?

我之所以问这个问题,是因为多年来我一直在使用 RAID,从来没有出现过故障,而且我也不确定到底发生了什么,所以我知道问题所在,而且修复它是否和更换灯泡一样简单?

如果新驱动器确实需要准备工作,运行多台服务器的人如何准备?您是否有已格式化并分配匹配分区的驱动器放在架子上,准备将它们换出?

我问这些问题是因为我想现在就知道,以便在硬盘出现故障时做好准备。谢谢!

答案1

一般来说,需要设置一个特殊的工具来监控系统内的硬件 RAID,但不同供应商的工具有所不同,例如,戴尔服务器有 omsa,惠普有自己的工具等等,最后需要设置电子邮件、陷阱等。还有控制工具(megacli,可以检查磁盘和硬件 RAID 的状态。而且大多数服务器都有指示灯,可以显示磁盘出了问题。更换大多是自动的,你拔出损坏的磁盘,插入一个具有相同大小/速度的新磁盘...并祈祷在重建期间不会影响其他磁盘 :)

md(软件 raid)磁盘更换可能涉及更多步骤,但到目前为止我从未更换过任何软件 raid 磁盘...

相关内容