在我们的刀片系统 c3000(hp 469499-b21)中,有一个 bl460c 刀片,与一个 sb40c 存储刀片配合作为 DAS。bl460 以无盘方式运行,存储刀片有 4 个驱动器配置为 raid 10 阵列。
存储刀片上有一个闪烁的红灯。Insight 显示屏上的机柜运行状况摘要不断在“健康”和“警告”之间交替,表明存储服务器托架中存在设备错误。
在 iLO 日志中,它还不断在“托架温度传感器故障...”和“OK”(如“所有系统正常运行”)状态之间交替显示。我对此非常担心,尤其是因为今天早上刀片服务器无法启动,因为故障的存储服务器显示设备错误,有时状态降低,并且直到我拔出刀片服务器并重新插入后才能工作。我在网上没有找到有关 iLO 日志中指出的此错误的记录。
我的数据被泄露了吗?我打算尽快买一个备用的,但我担心灾难很快就会降临。
这是一个 iLO 固件问题,可以通过升级解决吗?
如果我设法提供一个新的存储刀片,那么只需将硬盘驱动器连接到新的存储刀片而无需进行任何配置就可以了吗?还是有什么需要做的?
请注意,我们有另一个刀片+存储刀片,它们工作正常,没有显示任何警告或错误。我意识到这很可能是存储刀片本身的硬件故障,因为当将 2 对设备从托架 1-2 切换到 5-6 并反之亦然时,错误仍然存在于原始设备上,因此它不是托架位置或外壳问题。我的风扇和电源当然以正确的方式设置以容纳 4 个刀片。
抱歉,如果我缺乏重要的细节可以提供给您,您分享的任何信息都会很有帮助!
答案1
对于遇到同样问题的人(我怀疑任何人都会遇到它),其确切的OA错误日志在几秒钟内重复出现,具体如下:
刀片 x 环境温度传感器故障...状态为降级。
Blade x 报告健康状态正常。
托架 #x 中的刀片状态从“降级”更改为“正常”。
刀片 x 环境温度状态正常。
我们唯一的本地惠普合作伙伴的惠普支持根本帮不上什么忙。谢天谢地,经过几个小时的头撞墙和解剖存储刀片的每一寸组件后,结果发现温度传感器的插孔装反了。天哪,松了一口气!看看图片就知道我的意思了。谢谢大家!
答案2
如果您将磁盘(一起移动,保持顺序)移至另一个 SB40 单元,您的数据是安全的。我怀疑这是存储刀片单元的问题(温度传感器故障)。请致电 HP 支持部门或在线开立案例支持案例经理。