我有一台带有 LSI MegaRAID 9261-8i 控制器的服务器。最近我开始收到类似这样的警报:
Controller ID: 1 Consistency Check inconsistency logging disabled, too many
inconsistencies on VD: 0
Generated on:Sat May 12 04:06:40 2012
SYSTEM DETAILS---
IP Address: 192.168.1.29
OS Name: Windows 7 x64
OS Version: 6.01
Driver Name: megasas.sys
Driver Version: 4.5.1.64
IMAGE DETAILS---
BIOS Version: 2.120.33-1197
Firmware Package Version: 12.12.0-0045
Firmware Version: 3.21.00_4.11.05.00_0x05000000
VD 0 是包含系统磁盘的 RAID 镜像。
我搜索并阅读了相关资料,但找不到任何关于如何实际解决此问题的线索。我尝试运行 scandisk,但没有找到任何结果(正如我所料,因为 scandisk 读取控制器公开的磁盘,对吧?)。据我所知,MegaRAID Storage Manager 没有任何用于检查或修复物理磁盘的选项。该程序声称 VD 是“健康的”,并且两个磁盘的错误计数均为 0。
同样有点奇怪的是消息中的系统详细信息...IP 地址与 RAS(拨入)接口相关联,操作系统应该是 Windows Server 2011 SBS。
有其他人遇到过这种情况吗?该怎么办?
答案1
别担心。对于镜像磁盘或 RAID 1,一致性检查消息不是错误消息。它是系统内存子系统和缓存内存中每秒发生数千次的事情,称为缓存一致性,并且永远不会被报告。RAID1 一致性检查相当于内存缓存一致性。
一致性检查功能是一个同步过程。一致性检查的功能是确保主磁盘和副本磁盘上的数据匹配。用于执行此操作的方法是为主磁盘和副本磁盘中的数据条带生成奇偶校验,然后比较奇偶校验。此技术非常有效,而且比尝试比较每个数据字节要快得多。因此,消息“一致性检查在条带 33617 处发现 VD 00/0 上的奇偶校验不一致”在“技术上”是正确的,但对于 RAID1 来说,这并不值得担心,因为它与 RAID5 或 RAID6 中的数据奇偶校验错误的含义不同。由于您达到了编程阈值,因此 CC 日志记录已停止。
RAID1 一致性检查是一种同步不匹配。如果检测到一致性检查,则只是表明副本目前有陈旧数据。不一致的数据本身绝不是硬盘故障。它只是表明主磁盘上的新数据尚未放到辅助磁盘上。在没有巡逻读取故障的情况下,磁盘状况良好,数据安全。不存在性能问题。
答案2
根据 IBM 文档,这种情况可能发生在 RAID1 或 RAID10 上
https://www-947.ibm.com/support/entry/portal/docdisplay?lndocid=migr-5092480
上述文件写道:
通过以下方式减少磁盘分页:
- 使用缓存 IBM ServeRAID 适配器
- 增加系统内存量
答案3
如果您希望 92xx 卡的错误处理能力更强,则需要进行一对固件更新。在应用之前,您应该阅读下面最新固件中包含的更改日志,以确保您不依赖已贬值的功能或不会受到任何已知问题的影响。最新日志有全部先前的修复和已知问题已记录。
第一次更新将带您到:12.12.0-0048_SAS_2108_FW_Image_APP-2.120.63-1242——这是最新的中间固件,支持旧的固件标准,但也可以升级到当前版本。
这是 92xx 系列的最新固件。12.15.0-0239_MR_2108_SAS_FW_2.130.403-4660__MR4.12P3
每个固件都可以在不停机的情况下由卡应用和存储。需要重新启动才能激活固件,然后才能应用下一个版本。您的版本接近上面的中间固件,但我不知道它是否足够接近以允许您跳过它。只有 LSI 支持可以回答这个问题。我已经使用这对版本升级我们的旧卡,没有问题。
答案4
如果您在MegaRAID Storage Manager
日志中看到以下信息,那么就无需担心。
Consistency check done with corrections on VD: 0 (corrections = n)