对于可以容忍停机的服务器,使用热备盘还是冷备盘好?

对于可以容忍停机的服务器,使用热备盘还是冷备盘好?

换句话说,我应该在架子上留一个备用磁盘还是将其设置为热备用?

如果服务器出现短暂停机,那也不算世界末日。它不是网络服务器,也不是任何需要全天候提供服务的东西。将额外的硬盘设置为热备用有什么缺点(驱动器寿命/磨损等)吗?或者如果我不需要热备用的即时恢复时间,最好将其包装好放在某个架子上?

答案1

您无法测试冷备用驱动器的功能;据您所知,架子上的驱动器无法正常工作。除非您的机柜容量已满,否则请将其用作热备用驱动器。

这也意味着您无需进入即可恢复阵列中的完全冗余;这对于假期周末等很有用。

答案2

当您说“一点点停机时间”时,是否意味着如果您丢失了当多个驱动器发生故障时将分配热备用的 RAID 阵列本身,您就可以重建服务器或从备份中恢复?

服务器和驱动器是否在更换保修范围内?哪种保修?(24x7x4 或 9x5xNBD 还是其他?)

我会根据以下几点来选择它:

  • 您可以从备份中恢复,或者愿意承担多个驱动器故障的风险,并且您拥有良好的硬件保修 = 根本没有热备用和冷备用(只需使用保修服务更换损坏的驱动器)
  • 冷备用 = 如果您有多个服务器使用相同的驱动器类型,并且您想通过在机架上只放置一个冷备用驱动器来节省资金,以防其中任何一个服务器的硬盘驱动器出现故障,我会使用此选项。
  • 热备用 = 如果服务器至关重要并且您无法承受从备份中恢复的后果,或者不想承担与多个驱动器故障相关的风险,或者您不勤勉或没有合适的通知警报来知道驱动器出现问题(没有什么比驱动器在星期一出现问题并且当您决定返回数据中心时您在两周内都不知道这件事更糟糕的了),我会使用此选项。

答案3

Hotspare 有其自身的危险,因为它会导致自动重建。

由于 TB 中的阵列大小以及陈旧数据量,阵列在自动重建期间发现另一个缺陷的可能性相当大。重建时间较长,这加剧了这种情况。20 小时重建?在做正确的事情之前,您需要等待很长时间 (TM)。

因此,最好不要自动重建。如果驱动器发生故障,您需要在启动重建之前验证备份和故障转移机制。

为了减少重建前因驱动器故障而发生故障的可能性,您需要一个可以处理 2 个驱动器故障的阵列:Raid 6 或 Raid 10。

答案4

如果可以选择,为什么不选择热备用呢?这只是优点之一:当需要时,它将使您的工作更轻松。

相关内容