我们有一台 HP MSA70,配有 25 个 600GB HP SAS 10k DP 驱动器,连接到 HP P800 控制器。驱动器配置为 RAID 6。
昨天,发生了某种未知的“事件”,阵列掉线了。我们重新启动了服务器(运行 CENTOS 6.2),启动时,阵列控制器报告 13 个驱动器“丢失”。当我们查看阵列管理中的卷时,插槽 1-12 的每个插槽都有两个条目。一个显示 600gb 驱动器,另一个显示 0gb 驱动器。12 之后没有更多条目。
我们联系了惠普支持部门,他们让我们去寻求二级支持,几个小时后他们放弃了。他们说他们以前从未见过这种情况(这是我最喜欢从供应商那里听到的话)。
有人见过这种情况吗?我们是否丢失了所有数据?
谢谢。
答案1
老,老,老,老的...
- CentOS 6.2 是老的 (6.2,2011 年 12 月 6 日(内核 2.6.32-220))
- HP StorageWorks MSA70 是老的。(终止使用 - 2010 年 10 月)
- HP Smart Array P800 是老的。(生命终结 - 2010 年)
所以这让我认为固件和驱动程序也过时了。例如,在 2015 年没有理由运行 CentOS 6.2... 而且我假设没有做出任何努力来保持任何最新状态。
这也让我认为系统没有受到监控。假设是 HP 服务器硬件,系统 IML 日志说了什么?您是否正在运行 HP 管理代理?如果没有,可能会错过有关服务器和存储健康状况的重要消息。
您是否检查过 HP 阵列配置实用程序(或惠普固态表面张力仪)?
但最终,您可能会遭遇端口故障或扩展器/背板故障:
- 有多少条 SAS 电缆连接到机箱?如果连接了 1 条电缆,则很可能存在背板问题,因为机箱中的 SAS 扩展器。
- 如果连接了两根电缆,则可能存在 SAS 电缆、MSA70 控制器或 P800 端口故障。
您的数据可能完好无损,但您需要隔离问题并确定上述哪个问题是罪魁祸首。更换 SAS 电缆比更换 MSA70 控制器或 RAID 控制器卡要容易得多……但我想你可以在 eBay 上花 40 美元买到另一个 MSA70...