Areca 1880ix RAID 挂起

Areca 1880ix RAID 挂起

Areca RAID 控制器 ARC-1880ix-12(固件 1.50)在高负载时挂起。

我的设置是:
Chenbro 3U 机箱
Intel S5500BC 主板
Xeon 5603 CPU
16GB RAM
12 个 Seagate SAS 硬盘 ST32000645SS(其中 2 个为热备用,10 个为 RAID10)
Mellanox Infiniband HBA 卡

该服务器用作 Xen VM 的外部无限带宽存储。当负载很大时,Areca 的固件会挂起 - 甚至无法从 Areca 的以太网适配器访问它。重置服务器电源后,它会恢复正常运行。

当 Areca 挂起时,我可以确认它已通电(以太网链路处于活动状态)并且 Infiniband HBA 工作正常。

在此先感谢对问题可能存在的任何想法或建议!

答案1

您的问题和我几个月来遇到的问题一样。首先是 ARC-1220,然后是 ARC-1260。两者都已修补到 1.49 固件。

我怀疑最新的固件有问题,因为两张卡以前都运行良好。ARC-1220 变得不稳定,ARC-1260 可以工作但会挂起,即使在 1000 mbit 硬链接上播放 MP3 也会卡住并挂起。

答案2

有几件事——

  • 您运行的固件似乎比较旧。当前固件为 1.51 --http://www.areca.us/support/download/RaidCards/BIOS_Firmware/release_1.51.txt

  • 安装 Areca CLI 并检查驱动器和控制器的健康状况。

  • 看看是否可以使服务器脱机并运行一些 IO 基准测试并观察 sar 上的数据。

  • 如果很可能不是 Areca,请检查系统日志中是否有任何内核堆栈跟踪或系统/硬件错误。检查服务器/主板 BIOS 发行说明以及其中是否有任何内容。

千田

答案3

我的 Areca 1800IX-16-4G 也冻结了,似乎是 DRAM 故障。

检查事件日志并将 bootrom、固件、mbr0 更新为 1.52,然后重新启动,将 bios 更新为 1.52,然后再次重新启动并通过 RJ-11 至 COM 电缆(2 个文件)和超级终端升级 SAS 扩展器:

FW : sas2xfwYYMMDD.fw
    Command to update,
    1)"fdl code 0" to update new fw file
    2)"reset"

MFG data : mfgdat6gMMDD.rom
    Command to update,
    1)"fdl mfgb 0" to update new data file
    2)"reset"

after boot,
cmd > rev

相关内容