如何使用 Ubuntu 12.04 监控 HP Proliant 服务器的硬盘和 RAID 状态。在 Ubuntu 10.04 中,我可以使用 cciss-vol-status 定期查询 RAID 状态,但 cciss-vol0-status 在 12.04 上不再起作用。在 12.04 中没有 /proc/driver/cciss 或 /dev/cciss 目录。
答案1
呼呼...Ubuntu。:)
这是什么类型的 HP ProLiant 服务器?(请提供型号和代数)
您的驱动器设备将根据智能阵列控制器而有所不同。随着从 G5 到 G6 服务器的迁移,HP RAID 控制器驱动程序从旧版 CCISS 驱动程序升级至新版 HPSA 驱动程序。使用较新的驱动程序,您将看不到 CCISS 块驱动程序...设备将是/dev/sdX
。
无论如何,监控智能阵列 RAID 控制器的关键是安装 HP 管理代理。至少,您需要hpacucli
命令行实用程序。Ubuntu 和 Debian 一直没有得到 HP 的官方支持,而 Red Hat/SuSE 则不然。然而,Debian ProLiant 支持包其中包括适用于 Ubuntu/dpkg 系统的代理和工具。
这是一种更全面的方法,可以生成 SNMP 陷阱和灵巧的电子邮件警报。为了只是获取 RAID 配置和管理软件,hpacucli
从HP 的存储库。
您可能还需要apt-get install lib32gcc1 lib32stdc++6 libc6-i386
满足 32 位先决条件。
从那里,您可以使用一些常用hpacucli
命令来获取 RAID 状态。一个简单的例子:
[root@Woot ~]# hpacucli ctrl all show config
Smart Array P410i in Slot 0 (Embedded) (sn: 500143801664FE50)
array A (SAS, Unused Space: 0 MB)
logicaldrive 1 (279.4 GB, RAID 1, OK)
physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK)
physicaldrive 2I:1:5 (port 2I:box 1:bay 5, SAS, 300 GB, OK)
array B (Solid State SATA, Unused Space: 0 MB)
logicaldrive 2 (447.1 GB, RAID 1+0, OK)
physicaldrive 1I:1:3 (port 1I:box 1:bay 3, Solid State SATA, 240.0 GB, OK)
physicaldrive 1I:1:4 (port 1I:box 1:bay 4, Solid State SATA, 240.0 GB, OK)
physicaldrive 2I:1:7 (port 2I:box 1:bay 7, Solid State SATA, 240.0 GB, OK)
physicaldrive 2I:1:8 (port 2I:box 1:bay 8, Solid State SATA, 240.0 GB, OK)
SEP (Vendor ID PMCSIERA, Model SRC 8x6G) 250 (WWID: 500143801664FE5F)
答案2
事情似乎发生了些许变化。用户410516的回答虽然有些简短,但大致切中要害。
Hewlett Packard Enterprise 存储库现已管理这里。对于 Ubuntu 16.04,我发现我需要“管理组件包适用于 ProLiant”,该软件被描述为“适用于 Ubuntu、Oracle 和社区发行版的代理软件”。HPE 提供添加repo脚本脚本将其存储库添加到您的安装中。
$ ./add_repo.sh mcp
note : You must read and accept the License Agreement to continue.
Press enter to display it ...
END USER LICENSE AGREEMENT
...
此脚本未注册 HPE 的密钥,因此这操作说明:
curl http://downloads.linux.hpe.com/SDR/hpPublicKey1024.pub | apt-key add -
curl http://downloads.linux.hpe.com/SDR/hpPublicKey2048.pub | apt-key add -
curl http://downloads.linux.hpe.com/SDR/hpPublicKey2048_key1.pub | apt-key add -
curl http://downloads.linux.hpe.com/SDR/hpePublicKey2048_key1.pub | apt-key add -
运行apt update
以下新包即可使用。
- cpqacuxe
- hp-ams
- hp-健康
- hp-smh-模板
- hp-snmp-代理
- 哈帕库克利
- 启动配置
- 韓軍
- 丙酸杆菌
- hpssacli
- hpssaducli
我们可以apt install hpssa hpacucli hpssacli hpssaducli
。
$ hpacucli ctrl all show config
Smart Array P400 in Slot 0 (Embedded) (sn: XXXXXXXXXXXXXX)
array A (SAS, Unused Space: 0 MB)
logicaldrive 1 (956.9 GB, RAID 5, Interim Recovery Mode)
physicaldrive 1I:1:13 (port 1I:box 1:bay 13, SAS, 146 GB, OK)
physicaldrive 1I:1:14 (port 1I:box 1:bay 14, SAS, 146 GB, OK)
physicaldrive 1I:1:15 (port 1I:box 1:bay 15, SAS, 146 GB, Failed)
physicaldrive 1I:1:16 (port 1I:box 1:bay 16, SAS, 146 GB, OK)
physicaldrive 2I:1:9 (port 2I:box 1:bay 9, SAS, 146 GB, OK)
physicaldrive 2I:1:10 (port 2I:box 1:bay 10, SAS, 146 GB, OK)
physicaldrive 2I:1:11 (port 2I:box 1:bay 11, SAS, 146 GB, OK)
physicaldrive 2I:1:12 (port 2I:box 1:bay 12, SAS, 146 GB, OK)
Smart Array P400 in Slot 1 (sn: XXXXXXXXXXXXXX)
array A (SAS, Unused Space: 0 MB)
logicaldrive 1 (136.7 GB, RAID 1+0, OK)
physicaldrive 2I:1:1 (port 2I:box 1:bay 1, SAS, 72 GB, OK)
physicaldrive 2I:1:2 (port 2I:box 1:bay 2, SAS, 72 GB, OK)
physicaldrive 2I:1:3 (port 2I:box 1:bay 3, SAS, 300 GB, OK)
physicaldrive 2I:1:4 (port 2I:box 1:bay 4, SAS, 300 GB, OK)
我们可以看到那里有一个故障的驱动器,我们可以获得更换的详细信息:
$ hpacucli ctrl slot=0 pd 1I:1:15 show detail
Smart Array P400 in Slot 0 (Embedded)
array A
physicaldrive 1I:1:15
Port: 1I
Box: 1
Bay: 15
Status: Failed
Last Failure Reason: Hardware error
Drive Type: Data Drive
Interface Type: SAS
Size: 146 GB
Rotational Speed: 10000
Firmware Revision: HPDC
Serial Number: XXXXXXXXXXXXXXXXXXXX
Model: HP XXXXXXXXXX
PHY Count: 2
PHY Transfer Rate: 3.0Gbps, Unknown
答案3
答案4
以下步骤是我使其在 Ubuntu 16.04 上运行所采取的措施。
echo 'deb http://downloads.linux.hpe.com/SDR/repo/mcp xenial/current non-free' > /etc/apt/sources.list.d/hp.list
apt-get update
apt-get install hpacucli hp-health hponcfg hp-ams hp-snmp-agents hpmh hpsmh hpssaducli hpssa