我遇到了一个问题,运行“megalci -PDList -aAll”会导致我的一对服务器中的 6 个磁盘中的 2 个记录其他错误。这里再次详细介绍了这个问题。
我有两台 Dell R610 服务器。每台服务器有 6 张光盘,组织方式如下:
2 个 160GB SATA 磁盘,RAID 1
RAID 10 中的 4 x 300gb SAS 磁盘
当我运行 megacli 命令检查磁盘时,它会导致错误记录到 SATA 驱动器。两台服务器都是如此,这意味着 4 个驱动器受到影响。
我需要两件事:我需要帮助找出发生这种情况的原因以及如何阻止它;我还需要帮助消除错误,以便 Nagios 不再打扰我。目前,我愿意接受任何实现这些目标的方法。
两台服务器均运行 CentOS 6.3 x64。无论我使用 MegaCLI 版本 1.01.39、版本 8.02.21 还是版本 8.04.07,都会发生错误。以下是前三个驱动器的 Megacli -PDList -aAll 输出。这显示了两个坏驱动器和一个好驱动器。
[root@nfs1b ~]# /opt/MegaRAID/MegaCli/MegaCli64 -PDList -aAll适配器 #0
机柜设备 ID:32 槽位号:0 驱动器的位置:DiskGroup:0,Span:0,Arm:0 外壳位置:N/A 设备 ID:0 世界网络: 序列号:2 介质错误计数:0 其他错误数:1001 预测故障计数:0 上次预测故障事件序列号:0 PD 类型: SATA
原始大小:149.049 GB [0x12a19eb0 扇区] 非强制大小:148.549 GB [0x12919eb0 扇区] 强制大小:148.5 GB [0x12900000 扇区] 固件状态:在线、启动 设备固件级别:8A22 盾牌计数器:0 成功完成诊断于:N/A SAS 地址(0):0x1221000000000000 连接端口号:0(path0) 询价数据:K85DTA926Y1YFUJITSU MHZ2160BK G2 8A22 FDE 功能:不具备 FDE 启用:禁用 有担保:无担保 已锁定:已解锁 需要 EKM 注意:否 外国:无 设备速度:未知 链接速度:未知 媒体类型:硬盘设备 驱动器温度:N/A PI 资格:否 驱动器是否已格式化以用于 PI 信息:否 PI:无 PI 端口 0: 端口状态:活动 端口的链接速度:未知 驱动器已标记 SMART 警报:否
机柜设备 ID:32 插槽数:1 驱动器的位置:DiskGroup:0,Span:0,Arm:1 外壳位置:N/A 设备 ID:1 世界网络: 序列号:2 介质错误计数:0 其他错误数:1001 预测故障计数:0 上次预测故障事件序列号:0 PD 类型: SATA
原始大小:149.049 GB [0x12a19eb0 扇区] 非强制大小:148.549 GB [0x12919eb0 扇区] 强制大小:148.5 GB [0x12900000 扇区] 固件状态:在线、启动 设备固件级别:8A22 盾牌计数器:0 成功完成诊断于:N/A SAS 地址(0):0x1221000001000000 连接端口号:1(path0) 询价数据:K85DTA926W8EFUJITSU MHZ2160BK G2 8A22 FDE 功能:不具备 FDE 启用:禁用 有担保:无担保 已锁定:已解锁 需要 EKM 注意:否 外国:无 设备速度:未知 链接速度:未知 媒体类型:硬盘设备 驱动器温度:N/A PI 资格:否 驱动器是否已格式化以用于 PI 信息:否 PI:无 PI 端口 0: 端口状态:活动 端口的链接速度:未知 驱动器已标记 SMART 警报:否
机柜设备 ID:32 插槽数:2 驱动器的位置:DiskGroup:1,Span:0,Arm:0 外壳位置:N/A 设备 ID:2 世界网络: 序列号:2 介质错误计数:0 其他错误数:0 预测故障计数:0 上次预测故障事件序列号:0 PD 类型:SAS
原始大小:558.911 GB [0x45dd2fb0 扇区] 非强制大小:558.411 GB [0x45cd2fb0 扇区] 强制大小:558.375 GB [0x45cc0000 扇区] 固件状态:在线、启动 设备固件级别:D1S4 盾牌计数器:0 成功完成诊断于:N/A SAS 地址(0):0x50014ee7aab51c32 SAS 地址(1): 0x0 连接端口号:2(path0) 查询数据:WD WD6001BKHG D1S4WXF1E62KUYR7 FDE 功能:不具备 FDE 启用:禁用 有担保:无担保 已锁定:已解锁 需要 EKM 注意:否 外国:无 设备速度:未知 链接速度:未知 媒体类型:硬盘设备 驱动器温度:26C (78.80 F) PI 资格:否 驱动器是否已格式化以用于 PI 信息:否 PI:无 PI 端口 0: 端口状态:活动 端口的链接速度:未知 端口 1: 端口状态:活动 端口的链接速度:未知 驱动器已标记 SMART 警报:否
enter code here
由于这是戴尔重新贴牌的 LSI 制造的卡,我无法获得戴尔关于使用 MegaCLI 的帮助或 LSI 的帮助,因为重新贴牌。我用谷歌搜索没有得到任何帮助。
答案1
至于为什么会发生这种情况,似乎该版本的 MegaCli 软件发出了 SATA 驱动器不支持的命令。您可以通过获取控制器事件日志来验证这一点:
MegaCli64 -AdpEventLog -GetLatest 100 -f events.log -aALL
执行后,events.log 文件将包含控制器错误事件。如果原因确实是向驱动器发出了不支持的命令,则错误事件应如下所示:
事件描述: 意外感知: PD 07(e0x20/s7) 路径 1221000007000000,CDB: 4d 00 4d 00 00 00 00 00 20 00,感知:5/24/00
的意义代码5/24/00
,根据这张常用代码表,是“非法请求 - CDB(命令描述符块)中的无效字段”。
答案2
我找到了该问题的解决方案。
我终于找到了MegaCLI 4 版本这看起来与我的旧 Fijutsu SATA 驱动器很相似。
如果将来链接过时了,如果您愿意,仍然可以在 LSI 网站上下载稍微挖掘一下- 由于一个不为人知的原因,它被命名为“MegaRAID 820X MegaCLI - Linux,版本 3.00.03”,并提供版本 4.00.16 供下载。