RAID-1 磁盘故障问题

RAID-1 磁盘故障问题

假设在配备 P410i RAID 控制器的 HP DL 380 G7 服务器上有一个 2 驱动器 RAID-1 阵列。如果控制器确定两个驱动器中的一个发生故障,我认为它将自动启动,仅使用单个仍在运行的驱动器,并且服务器上的操作不会受到故障的影响。我的问题是控制器卡如何向操作系统 (Windows server 2008 SP2) 发出发生故障的信号。是否可以通知用户应用程序代码发生了故障,以便它可以将该信息传递给远程用户?如果发生故障,我希望我们的 UI 会显示一个错误对话框或图标,以通知用户发生了这种情况,并让他们启动故障单元的更换。

答案1

我非常了解那台机器(以及 G5/G6 等版本)——基本上,R1 在正常运行时会使用两个磁盘,这不像主动/被动设置——两个磁盘都在相互竞争读取,并且直到两个磁盘具有相同的数据时,阵列才会完全写入。您需要做的是安装最新的 Proliant 支持包(让我知道您使用的是什么操作系统,我会告诉您确切的 HP.com 页面),其中包括磁盘驱动程序,当发生预故障/故障时,它会向操作系统事件队列发出警报,以便您可以立即处理问题。

希望这可以帮助。

答案2

这将取决于硬件。通常,RAID 控制器会完全“隐藏”磁盘故障,至少在正常使用情况下是如此,因此操作系统无需知道、担心或关心磁盘故障。它只是继续运行,好像一切都很好一样。

通常,您需要使用某种特殊工具或实用程序(通常由您的服务器或存储供应商提供),以便查询和检测 RAID 设置下的硬件问题。

在(在本例中)HP 网站上查找 RAID 控制器管理工具和软件,它们可能与机箱驱动程序捆绑在一起或放在机箱驱动程序附近。它们应该提供一些您可以监控或可以提醒您硬件问题的东西。

答案3

HP 不提供实用程序来监控阵列吗?我会在 HP 网站上查找 P410i raid 控制器实用程序。

答案4

如果您希望应用程序向用户发出驱动器故障警告,则必须让应用程序轮询阵列状态。当然,如何执行此操作取决于应用程序以及阵列软件如何报告故障。

但是,我建议您设置一个监控系统,该系统会主动轮询这种情况并在发生时向某人发出警报。一个问题是,如果这种轮询失败,它往往会通过向您发出警报(“无法获取阵列统计信息”)来失败,而不是在您的应用程序中悄无声息地失败(阵列程序不会报告“驱动器故障”,因此我不会发出警报,即使它也没有报告成功)。此外,这意味着有人知道采取行动是他们的工作,而不是所有应用程序用户都看到它并认为其他人会查看它。

监控系统对于处理这个问题非常非常好。

但是,您已经领先一步,确保设置了阵列监控。许多人设置了 RAID,然后就忘记了,直到第二个驱动器出现故障。:-(

相关内容