我为学生会管理一台 HP ProLiant DL380 G6 服务器,这台服务器即将被我们大学丢弃。该服务器有一个 P410i 硬件 RAID 控制器,我们用它为我们的操作系统创建 3 个驱动器 RAID 5,为我们的 Owncloud 数据文件夹创建 4 个驱动器 RAID 10。
大部分情况下一切都运行顺利,直到最近我们开始收到大量磁盘错误,并且逻辑驱动器进入只读模式,直到使用 进行修复fsck
。DMESG 显示大量 IO 错误和有关逻辑驱动器被重置的消息,消息之间仅相隔 1resetting
秒reset successfully
:
除了缓存电池故障外,智能阵列似乎工作正常,物理驱动器和逻辑驱动器未显示任何错误,状态为 OK hpssacli
。但固件版本已过时,版本为1.62-0
。我尝试升级到最新固件版本,但遇到了与问题中相同的问题如何更新 DL360G6 上的 SmartArray P410i 固件?通过 SPP 自动更新的常用方法失败,但我只想将提议的解决方案作为最后的手段,因为它可能会损坏我们的 RAID 控制器。
我不确定是我们的驱动器出现故障还是我们的 RAID 控制器(固件中的错误)导致了问题,有人可以提供一些见解吗?
编辑:启动驱动器再次处于只读模式,并且 fsck 给出分段错误
答案1
sdb
正在死机,因为它没有及时响应主机命令。但是,据我所知,它sdb
实际上是一个阵列或逻辑卷/磁盘,因此它不代表任何单个磁盘。
最可能的原因是:
一个(或多个)物理磁盘即将损坏,可能是由于扇区重新分配风暴所致。您的物理磁盘是否支持 TLER?它们是企业级磁盘吗?
控制器本身存在一些问题。例如,这可能与其使用年限或工作温度有关。