我有两台 HP DL380 G7 服务器 + P812 控制器 + D2700 机箱。它们是具有 144 Gb RAM 的数据库服务器。P812 固件为 6.40,D2700 为 0147
它们都与 18 个 OWC Mercury Extreme SSD(SATA)配合得很好。在我将两个 D2700 机箱中的另外 6 个 SSD 添加至每个机箱中的 24 个 SSD 之后,与升级前和另一台服务器相比,其中一台服务器的磁盘性能非常差。
因此,我怀疑添加到性能不佳的服务器的 6 个 SSD 中有一个出现故障。但哪一个呢?HP 阵列配置实用程序未显示任何问题,POST 中也没有出现任何问题。甚至长篇 ACU 报告也没有显示任何内容。
因此,我想查看这些驱动器的 SMART 属性,看看能否找出出现故障的驱动器。是否有 Windows 工具可以让我查看此配置中的 SMART 属性?
在一个非常相似的问题中HP Proliant 服务器中的第三方 SSD 驱动器 - 监控驱动器健康状况建议使用 smartmontools 中的 smartctl。不幸的是,我无法看到 P812+D2700 后面的 SSD - 我该如何让 smartctl 工作?
C:\Program Files\smartmontools\bin>smartctl -a /dev/sdc,0 -T permissive -s on
smartctl 6.3 2014-06-23 r3922 [x86_64-w64-mingw32-2012r2] (cf-20140623)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Vendor: HP
Product: LOGICAL VOLUME
Revision: 6.40
User Capacity: 5,760,841,244,672 bytes [5.76 TB]
Logical block size: 512 bytes
Rotation Rate: 15000 rpm
Logical Unit id: 0x600508b1001cf0ebb14e9131d7XXXXXX
Serial number: PAGXQ0ARXXXXXX
Device type: disk
Local Time is: Fri Dec 12 18:42:32 2014 EST
SMART support is: Unavailable - device lacks SMART capability.
=== START OF ENABLE/DISABLE COMMANDS SECTION ===
unable to fetch IEC (SMART) mode page [Input/output error]
=== START OF READ SMART DATA SECTION ===
Error Counter logging not supported
Device does not support Self Test logging
以下是非常相似的问题建议的命令的输出(我将 /dev/sda 更改为 /dev/sdc,因为这是 P812 上第一个卷的设备:
C:\Program Files\smartmontools\bin>smartctl -a -l ssd /dev/sdc -d sat+cciss,1
smartctl 6.3 2014-06-23 r3922 [x86_64-w64-mingw32-2012r2] (cf-20140623)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org
/dev/sdc: Type 'sat+...': Unknown device type 'cciss,1'
=======> VALID ARGUMENTS ARE: ata, scsi, sat[,auto][,N][+TYPE], usbcypress[,X], usbjmicron[,p][,x][,N], usbsunplus, areca,N[/E], auto, test <=======
使用 smartctl -h 获取使用情况摘要
答案1
请提供详细说明您的预期和实际绩效数据的数字。
另外,SAS 拓扑是什么样的?主机和 D2700 JBOD 之间有多少条 SFF-8088 电缆?
正如我之前提到的,HP StorageWorks D2700了解 SMART 并报告SCSI 机箱服务(SES) 详细信息...但您的用例很狭窄。扩展器上有很多 SATA 驱动器。我们知道 SATA 超时可能会导致性能问题在共享扩展器背板上,如 D2700 中的背板。但是,这更可能是旋转介质问题;而不是 SSD 的问题。
根据我的经验,SSD 要么能用,要么不能用。两者之间没有太大区别(除非你已经达到了写入耐久性极限)因此,我要关注的是:
因为空间不足,所以你扩展了数组。没错如何扩展之前您的空间是否不足?我希望您没有耗尽空间。想想 SSD 和该控制器上缺乏 TRIM 支持。
我建议对这些驱动器进行低配置,或者限制逻辑驱动器尺寸来解释缺失的 TRIM 功能。
更新固件。您使用的是 D2700 机箱固件的不受支持的版本(已被召回),并且您的 RAID 控制器也落后了。截至撰写本文时,0149 是正确的 D2700 固件,并且你的控制器应该处于版本 6.60. 也升级主机。
也许是时候提高你的游戏水平. 24 个消费级 SATA SSD 位于超额认购的总线(RAID 控制器和 JBOD 背板)上,其中 6Gbps SATA 驱动器降档至 3Gbps,意味着您也已达到硬件的上限。Smart Array P812 控制器具有收益递减在约 6 个磁盘的 SSD IOPS 上。
答案2
这是原始问题的答案,要求视窗该工具允许我查看位于 D2700 机箱上 HP SmartArray P812 后面的 SSD 上的 SMART 参数:
我已于 2017 年 8 月 29 日编辑了答案。最初,我得出的结论是,没有基于 Windows 的工具允许我使用 P812 控制器查询 D2700 机箱中 SATA 驱动器的 SMART 参数,但我发现这并不完全准确。虽然 HP 阵列配置实用程序 (ACU) 不允许我询问SMART 参数确实如此通知当预测驱动器即将发生故障时,请通知我,并且此通知也会出现在阵列诊断报告中。
截至最初回答时,我考虑过这三位候选人,但当时他们都没有胜任这份工作。以下评论可能不再准确:
- SmartmonTools/smartctl - 根据 Linux 上的说明,查询 HP 控制器后面的 SMART 似乎受支持HP Proliant 服务器中的第三方 SSD 驱动器 - 监控驱动器健康状况但是 windows 版本的 smartctl 似乎不支持 cciss 驱动程序,而根据这
- HP SSA CLI - 对 HP 控制器有广泛的支持,但不支持 SMART - HP 似乎更倾向于他们自己的 SmartSSD Wear Gauge 技术。我使用的命令是:“controller slot=1 ssdphysicaldrive all show detail”,另一个有用的命令是“controller slot=1 show ssdinfo”
- HD Sentinel - 宣传支持 HP 控制器这里但当你读到细则时这里 它表示无法窥视 HP SmartArray 控制器