如上所述在之前的一个问题中,我们在 HP Proliant DL360 G7 服务器(使用 P410i RAID 控制器)中安装了 6 个 OWC Mercury Extreme SATA SSD 驱动器。它们工作得很好,而且速度非常快。但是,我知道 SSD 驱动器不幸不会永远使用,而且 HP ACU 实用程序不会监控任何驱动器的运行状况,这并不奇怪:
是否有人知道任何 Windows(Server 2008R2)软件或实用程序可以监控阵列中每个驱动器的运行状况,以便我们可以主动发现任何潜在问题?
答案1
您可以使用 smartctl 查看 cciss RAID 控制器后面的各个驱动器,如下所示:
smartctl -a -l ssd /dev/sda -d cciss,1
或者:
smartctl -a -l ssd /dev/sda -d sat+cciss,1
-l ssd
(如果你的 smartctl 太旧,则可能需要删除)
答案2
别打扰...真的。
您有一台配备企业 RAID 控制器和热插拔驱动器的企业服务器(带有5 年保修),大概是 RAID 1+0 设置。你关心为什么驱动器故障除了本身故障之外还有什么其他原因?我不知道。我也不关心旋转磁盘为什么会坏掉(SMART 错误、轴承故障、过热等。)
高端 (SAS) HP 固态硬盘做提供一些额外的健康信息。但如果你正在使用 RAID 并且知道在哪里可以得到备用磁盘,我认为这些信息不会有太大帮助。你可以获得温度读数和“预计剩余寿命”数字。
就这些。
physicaldrive 1I:1:4
Port: 1I
Box: 1
Bay: 4
Status: OK
Drive Type: Unassigned Drive
Interface Type: Solid State SAS
Size: 400 GB
Firmware Revision: HPD9
Serial Number: 00197356
Model: HP MO0400FBRWC
Current Temperature (C): 29
Maximum Temperature (C): 43
Usage remaining: 99.57%
Power On Hours: 6418
Estimated Life Remaining based on workload to date: 61922 days
SSD Smart Trip Wearout: False
PHY Count: 2
PHY Transfer Rate: 6.0Gbps, Unknown