突然间,一台服务器的电源开始发出难闻的气味。其中一个热插拔电源坏了。我们更换了它,启动了 Windows Server 2003,发现 RAID 5 配置中的 4 个驱动器中有 2 个坏了。
我们有时也会遇到 MACHINE_CHECK_EXCEPTION BSOD。
电源对 RAID 造成这种影响的可能性有多大?在发生这种情况的几分钟前,我们确认 RAID 正在工作(我们在注意到难闻的气味之前正在使用 RAID)。
谢谢您的任何建议!:)
答案1
虽然这种现象不应该发生在设计良好的电源上,但现实情况是这种情况经常发生。当设备快要报废时,它可能会失去电压调节能力,导致机器供电过压。如果你的驱动器因此而损坏,那么你需要为其他组件的故障做好准备。理想情况下,服务器应该下线并进行压力测试,但现在谁有工具可以做到这一点呢?
假设您有冗余电源,而不是只有一个热插拔装置,建议您也准备一条电源线。毕竟,如果您不能正常使用这样的设备,那么拥有它就毫无意义。
答案2
这种情况可能会发生,这就是为什么建议在安装有 BBU 的服务器和/或 RAID 控制器中使用冗余电源。
答案3
虽然电源故障可能会损坏组件,但我认为这种情况不太可能发生。如果这两个驱动器是特定电源线上仅有的两个驱动器,那么我会怀疑电源可能已向该线路发送了超过 12v 的电压。否则,更有可能的是您的阵列中有几个您不知道的坏驱动器。关闭它们的电源只会显现出问题。每当您停止一个多年来一直不停旋转的驱动器时,您都面临着它可能无法正常重启的风险。