对于新的 2x8TB 文件服务器,哪种 RAID/LVM 配置最安全?

对于新的 2x8TB 文件服务器,哪种 RAID/LVM 配置最安全?

我刚刚安装了一台全新的 PC 作为文件服务器。它有一个 60gb SSD 用于操作系统(ubuntu 12.04),还有 8 个 2tb 数据驱动器。我正在寻找最安全、最稳定的方法来设置具有冗余的单个巨型存储池。

注意事项:

  • 我的首要任务是保护数据。可用性、可靠性、弹性、可恢复性和风险管理。所有这些词都意味着不要丢失我的文件。
  • 我不仅关心 RAID 类型性质所隐含的理论风险,还关心简单性和最小故障点的实际考虑。特别是考虑到我不是 RAID 或 FS 技术专家,而且我排除故障的能力仅限于我能在 Google 上找到的信息。
  • 这不是一个写入密集型的,像有交易日的数据库服务器一样,它主要用于保存各种流媒体,以及所有用户用于网络访问的文件。
  • 我最可怕的噩梦是发现由于某种混沌理论的阿尔法粒子从太阳中射出并落入电容器,导致我的硬盘/元数据/主板/软件/任何东西出现错误,导致整个阵列无法恢复。DOOM&H8!
  • 因为我将传输数据,所以读取速度优势是值得赞赏的(但这是次要的)
  • 最终我可能想要添加驱动器,使用 LVM 池化 RAID1 对,这很容易。是否必须使用空白驱动器从头开始重建 RAID6 或 RAID10 阵列?
  • 如果这相关的话,我将 8 个驱动器插入 ASRock Z77 Extreme4 主板上的 8 个板载 SATA 插槽,其中 4 个是 SATA2,4 个是 SATA3。操作系统位于连接到 PCIe SATA 控制器的 SSD 上。8GB 内存。
  • 参见#1——我的首要任务是保护数据。

我读到过 RAID6 实际上风险较小,因为任何 2 个磁盘都可能发生故障,而不是每个镜像对只有一个磁盘发生故障,而且 RAID6 的主要缺点是写入速度,而我对此并不担心。我已经接受了一半驱动器因镜像而丢失的事实,所以我不想因为考虑 RAID6 而显得太贪心,但如果它实际上更安全、读取速度更快,并且让我保留 12 GB 而不是 8 GB,那么不这样做也许很愚蠢。或者也许我错过了更大的图景

我想我所问的是8-12驱动器阵列的缺点,或者哪一个最适合数据保护,以及在较小程度上读取速度。

  • LVM(4x2tb) + 独立磁盘的夜间 cronjob 备份
  • LVM(4xRAID1)
  • (RAID10)
  • (RAID6)

感谢您的帮助!

答案1

如果你的数据真的很重要,丢失数据意味着要和电器一起洗澡,那么就没办法再需要第二台服务器来镜像设备了,拥有真正的备份。在一台服务器上执行的任何操作都至少有一个单点故障。(至少是服务器本身 - 举个最基本的例子,如果发生火灾怎么办?或者电源出故障并带走其他所有东西怎么办?等等。)

出于同样的原因,你需要真正的备份,并保留某种内容。没有任何备份意味着数据损坏也可能导致整个系统被毁,因为如果你将一个系统复制到另一个系统,你很可能会复制发生的任何损坏。

由于这里还没有人说过,RAID6 和大型 SATA 磁盘并不是一个好的组合。它确实比 RAID5 设置提供了更多的冗余,但还不够。在如此大的磁盘上,您几乎肯定会在其中一个奇偶校验条带上出现读取错误,这实际上意味着在某个磁盘上(但您不知道在哪里),您实际上是在 RAID5 中运行。这一切都很好,直到磁盘发生故障。然后您将在失败的阵列 RAID 上运行,这对关键数据来说风险太大了。

在磁盘故障方面,RAID6 的问题与 RAID5 相同 - 奇偶校验位计算很复杂,需要花费大量的时间、资源和 I/O,这意味着重建期间发生阵列故障的风险实际上比您想象的要大,我实际上已经看到了 RAID6 阵列(甚至带有热备用)在重建期间发生故障的噩梦场景 - 考虑到重建所需的所有 I/O,这并不令人震惊,但如果发生在您身上,则是毁灭性的。

我建议在 2xRAID10 中运行它,因为它物有所值 - 您可以获得性能优势以及一定程度的冗余。在镜像 RAID 中重建故障磁盘比在任何基于奇偶校验的系统中都要快得多,因此也更安全。如果这很重要,我家里有一个 12 磁盘 RAID6 阵列(12x2TB 近线 SAS),所以我确实喜欢 RAID6,但它对于关键数据来说不够安全。

最后要说的是,你不会想通过触电自杀。这非常痛苦,所以你最好选择其他自杀方式。

答案2

最安全?双轴 RAID60。或者更好的是 ZFS。别忘了备份!

答案3

我真的不欣赏你最后的考虑——如果我丢失了文件,我会用烤面包机去洗澡。 这会让人们不愿意回应,尽管这应该很有趣(或者是吗?)。

继续说,数据弹性存储只是一个神话,一切都可能失败。为此做好准备。从您的要求来看,有几点观察,

[1] 您的单个 SSD 驱动器可能会发生故障。您不是 RAID 或 FS 方面的专家,您将如何恢复数据?它是企业级 SSD 吗?SSD 在这方面能为您提供什么帮助?

[2] 我假设您使用的是“台式”级硬盘。它们不是为全天候运行而设计的,也不是为更长时间而设计的。典型的台式机硬盘有 1 年或 2 年的保修期,而企业级硬盘有 3 到 5 年的保修期。

[3] 您使用的是主板上的板载 RAID。虽然这可能有效,但设置和管理起来很困难。真正的硬件 RAID 控制器为您提供更好的保护、性能和更易于使用。如果您负担得起,那就买吧。不过,请确保 RAID 控制器上的固件是最新的。

[4] 主板、RAM、电源、电源都可能出现故障。您是否准备好从其中任何一个设备恢复数据,因为故障可能会导致数据损坏/丢失。如果您不关闭 HDD 驱动器上的缓存(将其设置为直写模式),您可能会在传输过程中丢失一些数据。

这些只是一些建议,

  • 在 8 个驱动器中,将 2 个驱动器专门设置为热备用。您将需要它们。
  • 如果可以的话,购买企业级硬盘
  • 使用 LVM 或 zfs 作为文件系统。检查 FreeNAS。
  • 定期备份和快照您的数据(包括您的配置文件,尤其是您的 RAID),并将其存储在其他地方。
  • 避免所有单点故障——启动驱动器、电源、网卡(绑定/组合会有所帮助)。
  • 购买保修期较长的主板。有些主板保修期为 5 年,并且是军用/工业级制造的。
  • 使用 RAID 6
  • 确保服务器有足够的冷却和气流
  • 运行完整的定期监控以保持主动性。检查 CPU/HDD 温度。检查 CPU/冷却风扇速度。检查 SMART 是否存在可能的磁盘故障并提前更换它们。检查文件系统一致性。

如果您负担得起,并且数据非常关键,请构建另一个存储(使用不同制造商的组件),并使用 DRBD(或其他任何方式)在两个存储服务器上进行复制,从而实现冗余。在工作中,我们在企业级硬件上使用 GlusterFS 将复制因子保持在 3。

希望这可以帮助。

答案4

如果您要使用 RAID 6 路线,那么请帮自己一个忙:访问 eBay 并购买几张 PERC 6/i 卡(一张作为备用)和两根 SFF-8484 到 4xSFF-8482 电缆以连接驱动器。稍后您会感谢我的。

如果您决定使用 ZFS,那么请全力以赴并设置 NexentaStor。这可能是将数据保存在预定位置所能获得的最安全的方法。

仔细考虑备份策略;RAID 和 ZFS 都不是备份。备份 TB 级数据并不容易,也不便宜;通常无法通过互联网完成,而且 TB 级的“云”存储比硬盘要贵得多。

相关内容