Soft-Raid HDD 故障信号支持

Soft-Raid HDD 故障信号支持

我有一个家庭服务器项目,已经做了一段时间了。它是一个 Web 和文件存储/备份服务器。它在 Debian 8 上运行。我一直在考虑升级我的存储选项,因为我的大约 5TB 空间已经不够了。

我希望能够设置一个 ZFS 文件系统,从 4 x 2TB HHD 开始。(6TB 存储和 2TB 奇偶校验)我正在考虑购买 Icy Dock MB455SPF-B,并注意到 LED 支持红色“HDD 故障”信号。在细则中写道:

*硬盘故障信号由外部主机(如 RAID 控制卡或主板)提供。请确保您的控制卡/主板可以通过电压引脚提供硬盘故障信号才能使用此功能。

如果我需要更换驱动器,我希望能够使用此功能来帮助消除任何错误。但我不确定是否支持此“故障信号”,我没有看到它列在我查看过的任何主板规格或 SATA 控制器中。这是一个常见功能吗?还是通常只有 RAID 卡才有?如果我的主板没有它。我可以买一个有它的 SATA 控制器卡吗?(我不想要一个全功能的 RAID 卡)此外,我必须假设 ZFS 软件也需要支持它?这是一种标准化的东西吗?

谢谢你的知识!

当前设置/说明:

  • 主板:英特尔 D925XBC 带英特尔 p4 单核(是的,旧款)
  • HHD:2 x 1TB,1 x 3TB
  • 希望升级所有东西,因为它显然已经很旧了。我原本打算先从硬盘开始。可能还是会用旧的、用过的东西,因为它不会做任何太过激烈的事情。
  • ZFS 因为它的卷相当大,所以 RAID 的可扩展性很好。大多数数据都是长期存储的,所以我不想担心在我不看的时候发生任何缓慢而无声的数据损坏。而且奇偶校验也很好。
  • 软 raid 因为... 嗯,我认为 ZFS 只提供软件 raid 对吧?还因为它不需要疯狂的性能,而且如果它坏了,我也不想费心去寻找完全相同的 raid 控制器。

编辑:

所以我开始觉得这基本上只是服务器的事情。而且爱好者们并不关心。这对我来说似乎很奇怪,我原本以为更多的闪烁灯会符合大多数人的期望。

继续阅读之后,似乎“故障 LED”区域有些变化且不标准。

据我所知,唯一可靠的方法是购买一台真正的机架式服务器,并配备一个可与 HDD 背板通信的 RAID 卡。这样,一切都通过 RAID 卡控制,它可以完成所有故障 LED 操作。

如果你建立自己的单位,使用软件 raid。有类似的东西通用输入输出接口这应该可以工作,但它似乎有几个名字,SFF-8485、IPASS,可能是 mini-sas 的一部分?似乎没有什么完全清楚的。另外,我认为 SES-2 可以做到这一点?我在我的问题中提到的 Icy Dock 外壳是如何做到这一点的,我不明白,基本上没有文档。似乎有一些实用程序,如莱德蒙它可以使用支持 SGPIO 的 HBA 来控制 LED,但您需要手动执行此操作,或者使用自制脚本。

因此,只要您能找到具有 SGPIO 的 HBA(主要是服务器单元,不太难找到,但价格昂贵)和同样使用 SGPIO 的 HDD 外壳(也主要是服务器的东西,很难找到,因为通常这只是服务器机架的前端)并且您可以编写一个可靠的脚本来检查 HDD 的状态并相应地更新 LED。您应该一切就绪

答案1

您的假设是正确的,此功能在消费市场并不受欢迎。大多数人最多有 2 - 6 个磁盘,因此按照 Michael 的建议给它们贴标签非常简单、便宜且容易。毕竟,您可能不会每小时遇到 2 个死盘,但可能 3 年内会遇到一个死盘。此外,如果您的服务器位于客厅或卧室,LED 可能会让您烦恼。

另一方面,假设您有 50 个机架,每个机架有 10 个系统,每个系统有 24 个磁盘,总共有 12000 个磁盘。您可能每天必须更换几个磁盘。能够进入机架并快速识别正确的磁盘变得更加重要。读取 240 个序列号很快就会让您发疯,而意外移除错误的磁盘会让您陷入困境。因此,您要做的就是使用指示灯快速找到候选磁盘,然后读取并验证标签上的序列号,并将其与您的错误报告信息进行比较(因为每个软件都可能有错误)。

此外,“故障驱动器”的定义对于所有人和所有情况来说都不相同。空托架(未连接到驱动器)可能是严重的连接故障,也可能只是 raidz3 阵列的例行维护。正常运行的磁盘返回一些读取错误可能表示情况危急,需要立即更换,或者如果它在一定时间内低于某个阈值,则无需担心。

相关内容