我们在 SAN 中运行 SSD 阵列,性能非常好。但我们需要监控写入耐久性 SMART 属性,以便确定驱动器何时接近磨损。我们测试了这些驱动器并确认我们可以获取该数据,但没有在 SAN 中尝试。现在我们发现我们的 SAN(Dell PowerVault)没有任何方式查询 SMART 数据。它所做的只是查询一些属性并生成报告。该报告不包含我们需要的属性。
有没有什么方法可以访问我们的驱动器的 SMART 数据,而无需将它们从阵列中取出并放入另一台机器中读取数据?
答案1
MD3620f 不通过模块化磁盘存储管理器 SMcli 提供此信息,也不在任何支持包文件中包含 SMART 数据。
无需移除驱动器即可获取 SMART 数据的唯一希望是通过 SNMP 轮询,因为这往往会获取机箱中每个组件可能获取的任何数据。如果 SNMP 没有提供数据,那么控制器固件可能根本不会从 SATA 磁盘获取 SMART 数据。
来源:担任戴尔 MD3 系列阵列支持高级工程师的亲身经历
编辑:ewwhite 也提出了一个很好的观点 - 没有必要主动监控此阵列中的 SSD,除非您继续使用它超过其使用寿命或没有保修范围(在这种情况下,这些数据至少会“有用”)。如果您使用 SSD 进行缓存,则无需担心。SSD 故障可能会对性能产生轻微影响,但保修更换后,一切就和新的一样了。如果您将 SSD 用作磁盘组的一部分(不使用较新的 SSD 缓存或磁盘池功能),请考虑使用 RAID6,这样您就不必担心任何高级别风险。
答案2
一般来说,这由存储固件管理。这也不是你的问题,因为如果 SSD 出现故障,无论你如何使用它,供应商都会更换它。
答案3
直接查询它们就没那么幸运了。您的 SAN 设备需要以某种方式(SNMP 或某些专有监控接口)提供该数据。
答案4
我同意让存储阵列处理这个问题。有有很多误解关于如何维护和管理SSD存储...
在这种情况下,将它们视为磁盘。
- 突袭他们。
- 有备用的。
- 保持您的支持合同有效。
- 利润。
无需预先更换您的 SSD。如果您的写入负载确实非常重,那么您还应该使用针对该工作负载进行优化的 SSD。它们存在!
企业 SAS SSD 可以通过 RAID 控制器或 SAN 报告的内容示例:
physicaldrive 1I:1:4
Port: 1I
Box: 1
Bay: 4
Status: OK
Drive Type: Data Drive
Interface Type: Solid State SAS
Size: 400 GB
Firmware Revision: HPD9
Serial Number: 00197356
Model: HP MO0400FBRWC
Current Temperature (C): 29
Maximum Temperature (C): 43
Usage remaining: 99.51%
Power On Hours: 11672
Estimated Life Remaining based on workload to date: 98765 days
SSD Smart Trip Wearout: False
PHY Count: 2
PHY Transfer Rate: 6.0Gbps, Unknown