我正在尝试使用 nagios 监控 HP Smart Array 控制器。我在 2 个 RAID1 阵列上有 4 个磁盘,因此每个 RAID1 有 2 个磁盘。
我安装了 nrpe-server 和 nrpe-plugins,并且正在使用全能check_raid
插件,但它似乎只能看到我的第一个数组,而看不到第二个:
# /usr/lib/nagios/plugins/check_raid
OK: cciss:[/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 0 status: OK, /dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 1 status: OK]
cciss_vol_status
两个数组均正确报告:
# cciss_vol_status /dev/cciss/c0d0
/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 0 status: OK.
/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 1 status: OK.
# cciss_vol_status /dev/cciss/c0d1
/dev/cciss/c0d1: (Smart Array E200i) RAID 1 Volume 0 status: OK.
/dev/cciss/c0d1: (Smart Array E200i) RAID 1 Volume 1 status: OK.
我如何才能check_raid
报告这两个阵列?
该服务器是带有 Smart Array E200i 控制器的 HP Proliant DL360 G5。它当前运行的是 debian wheezy。
答案1
我的建议是使用HP 管理和健康代理用于服务器。这些可以发送电子邮件、转储到系统日志并发送 SNMP 陷阱。
如果你绝对地必须在 Nagios 中报告此问题,似乎有有很多选择。但是 HP 工具集的一个组件是hpssacli
或hpacucli
实用程序,其输出可以解析:
# hpssacli ctrl all show config
Smart Array P420i in Slot 0 (Embedded) (sn: 001438025AC2EA0)
Internal Drive Cage at Port 1I, Box 2, OK
Internal Drive Cage at Port 2I, Box 0, OK
array A (SAS, Unused Space: 340650 MB)
logicaldrive 1 (72.0 GB, RAID 1, OK)
logicaldrive 2 (600.0 GB, RAID 1, OK)
physicaldrive 1I:2:1 (port 1I:box 2:bay 1, SAS, 900.1 GB, OK)
physicaldrive 1I:2:2 (port 1I:box 2:bay 2, SAS, 900.1 GB, OK)
SEP (Vendor ID PMCSIERA, Model SRCv8x6G) 380 (WWID: 5001438025AC2EAF)
或者
# hpssacli ctrl slot=0 ld 1 show status
logicaldrive 1 (72.0 GB, 1): OK
# hpssacli ctrl slot=0 ld 2 show status
logicaldrive 2 (600.0 GB, 1): OK
或者可能:
# hpssacli ctrl all show config | grep logicaldrive
logicaldrive 1 (72.0 GB, RAID 1, OK)
logicaldrive 2 (600.0 GB, RAID 1, OK)