我们负责照看一台富士通 RX300 S4 服务器,该服务器有 6 个 500GB SATA 驱动器,组成一个 RAID-6 阵列,由 LSI MegaRAID 卡(内置于主板)运行。
几周前,一个硬盘驱动器显示自身有故障(驱动器托架上亮起橙色灯,MegaRAIDcli 软件显示固件状态为“故障”)。我们订购并更换了该驱动器,但在重建开始后,另一个驱动器显示自身有故障。
这种情况已发生过 3 次 - 两次标记出有故障的不同驱动器,一次标记出我们已经更换过的驱动器。
目前,两个驱动器出现故障 - 我们不知道驱动器是否实际上故障,或者背板或 RAID 卡是否有故障。
以前有人遇到过这种情况吗?有什么建议吗?我们打电话给富士通,但不知道那里是否有人能指点一下……
答案1
我理解你的感受。这种硬件问题调试起来非常麻烦和烦人。
早在 2002 年,我就曾“愉快”地调试过类似的问题。在反复说了“让我们更换硬盘”等类似的话后,我发现服务器背板的损坏才是真正的问题所在。但那是一台 IBM 服务器,而且是完全不同的故事。
如果可能的话,用另一台服务器测试“故障”驱动器,看看它们是否在那里正常运行。我的直觉告诉我,你的情况不是驱动器的问题,而是其他东西坏了。驱动器通常不会这样坏。
答案2
这可能是因为控制器故障。可能是因为电源不可靠。可能是因为 SATA 电缆有问题。也可能是因为运气太差。