如果 RAID 控制器出现故障,是否会中断服务直到更换为止?

如果 RAID 控制器出现故障,是否会中断服务直到更换为止?

如果我在 RAID 1 中安装了 2 个驱动器,而 Raid 控制器出现故障,这是否意味着服务器上的网站将停机,直到更换控制器?还是一切仍会以软件 raid 的形式自动运行,直到更换有故障的 raid 卡?

答案1

或者一切是否仍以软件 RAID 的形式自动继续,直到更换有故障的 RAID 卡?

那将如何工作?软件会神奇地绕过充当磁盘控制器的硬件 RAID 吗?操作系统不仅看不到磁盘,而且它们实际上物理连接到硬件 RAID 控制器。如果控制器发生故障,那么您与磁盘的连接也会失败。

所以不行,你只能倒闭。这就是为什么小型设置从云服务中获益良多,而大型设置拥有多台服务器的原因。

答案2

Raid 控制器发生故障

我是一名电子工程师,所以我对“失败”一词的心理印象可能与软件工程师不同......我的意思是,你们多久戴一次安全眼镜进行调试?

如果您的 RAID 控制器板出现任何类型的硬件故障,包括 MOSFET 短路、钽电容器爆炸、电源故障等,则可能会发生许多事情,例如您的服务器电源因检测到短路而关闭。在这种情况下,一切都会停止。

如果 RAID 卡上的主芯片突然坏了,接下来会发生什么在很大程度上取决于操作系统和驱动程序如何处理外围设备的突然意外坏掉。例如,我的 PC 硬盘坏了。操作系统等待硬盘响应时,PC 会冻结一段时间。

编写操作系统和驱动程序的人通常在正常工作的硬件上执行此操作。因此处理“扩展卡 CPU 刚刚着火”的代码从未被调试过。不能怪他们。这是现实。

有一次我设计了一个 USB 外设。我很快发现我必须用一台破旧的笔记本电脑来调试它,因为如果我的 USB 外设出现一点点问题,操作系统就会发出 OMFG 警报并崩溃和/或重新启动。

归根结底,PC 内部的卡发生硬件故障可能会产生各种后果,从没有任何后果到内核崩溃或完全关闭。因此无法回答您的问题。RAID 卡故障类似于主板故障。唯一重要的是恢复您的数据。

答案3

您要么设置软件 RAID,要么设置硬件。软件无法神奇地拾取,因为软件将 RAID 1 中的两个磁盘视为单个磁盘。它不知道卡后面的物理磁盘。它只知道 RAID 卡向操作系统呈现的内容。

所以回答你的问题,如果 RAID 卡出现故障,那么服务器也会随之瘫痪。不过 RAID 卡出现故障的情况非常罕见。

答案4

如果您确实需要这种级别的可用性,那么我建议您研究一下 Stratus technologies ftServer,正常运行时间为 99.999%。您可以使用大多数操作系统,并且无需更改应用程序中的任何内容。

大约 10 年前,我在那里从事内部存储工作。我们可以出其不意地移除任何设备(实际上可以随时断言 pci 重置),检测故障并故障转移到辅助设备,而不会中断服务。这是通过使用锁步技术实现的。

然而,它的价格昂贵,但并不离谱;相当于同等服务器的 3-4 倍。通常购买这些服务器的人会以每秒数万美元的停机时间计算,否则生命就会受到威胁。

相关内容