降低因断电导致数据损坏的风险

降低因断电导致数据损坏的风险

目前,我们有许多服务器,这些服务器经常会因为各种原因而停电。这些服务器都运行 ESX 和几个 Linux 客户机。在这里安装 UPS 目前还不切实际,所以我正在寻找一些可以降低文件系统损坏风险的方法。

我最初研究的是 RAID 控制器(并非专门用于磁盘冗余),但我读到使用缓存等功能实际上会增加数据丢失的风险。带有缓存电池的控制器似乎也有帮助,但我并不完全相信。

是否有人知道 RAID 控制卡是否确实提供这种保护,或者我们通常可以做些什么来降低风险?

答案1

存储控制器可以配备电池供电的写缓存和/或超级电容器对于 SSD,在断电期间保护缓存写入。
确实存在这些仍无法保护数据完整性的情况,尽管 BBWC 比使用无电池的写入缓存提供更好的保护,但完全禁用任何和所有写入缓存(以牺牲一些性能为代价)可能更可靠。

但推荐的工具仍然是 UPS,因为即使是小型 UPS 也能让系统在停电期间电池电量接近耗尽时正常关机(以及保护硬件免受电源反复峰值的影响)。

答案2

RAID 控制器基带单元有时降低非正常关机时出现文件系统错误的风险。有时因为你不能保证在磁盘上写入某些块时文件系统上的操作系统不会被杀死,因此操作系统将变得不可用(但不一定文件系统不可用)。与此同时,我会投资一些(非常小的)UPS,比如,以便服务器能够在断电时正常关闭。

编辑:嗯,@HBruijn 抢先了一步:)

答案3

如果单个主机具有单个 RAID,并且启用了写回缓存,那么某天肯定会出现数据损坏问题。

看一下软件定义存储解决方案,该解决方案提供 =>2 次故障容忍度(存储 2 个以上数据副本)。拥有一个节点集群,其中每个节点都与 UPS 连接,并在 RAID 10/6 之上提供共享存储,可能会将数据损坏减少到零。显然,应该将 2 条独立电源线连接到 UPS。有了这种设置,您肯定可以启用/使用缓存。

相关内容