Proliant ML310e Gen8 智能阵列 SSD 预测故障问题

Proliant ML310e Gen8 智能阵列 SSD 预测故障问题

这是一个与此相关的问题:

ProLiant Gen8 服务器中的第三方 SSD 解决方案

但问题和答案均未涵盖。

我在 Proliant ML310e Gen8 服务器上安装了 OCZ 120 GB SSD 作为系统驱动器,位于 SATA 端口 6 上。为了将该端口(在主板上)用于 SSD,我必须将 SATA 控制器设置为 SMART Array 控制器。这样我就可以将所有 4 个托架用于 RAID 硬盘驱动器组。

到目前为止一切顺利。我还在系统驱动器上安装了 Win Server 2008 R2,一切运行良好。

但是 - 当我检查 SMART 阵列时,它显示“预测驱动器 0 (SSD) 故障”。我已检查并验证了 SSD 的实际 SMART 设置,驱动器 100% 正常。它是全新的,并且 OCZ 支持已验证 SMART 设置 100% 正常。

我无法在 HP 诊断方面清除此错误,并且按照 OCZ 的建议,我一直试图弄清楚如何关闭 HP 上的 SMART 诊断,但无济于事。

那么 - 我该如何清除 HP SMART 阵列(不正确)对 OCZ SSD SMART 数据的诊断读数,或者我该如何关闭 HP 对 SSD 的 SMART 统计数据的读取。

我意识到这完全是我自己的问题,因为我不愿意花 1000 多美元购买 HP 品牌的 SSD,但 OCZ 的 SSD 运行得很好。只是 OCZ 版本的 SMART 与 HP 的 SSD 驱动器统计数据 SMART 理念不同,而且我真的厌倦了黄色闪烁的“系统降级”前面板灯。

是的,我已经被告知“用黑色电工胶带把它贴起来”。:-)

但我真的想找到一个更好的解决方案。这个 SMART 东西应该是准通用的。

答案1

我在内置 b120i 端口 5/6 上运行带有 SATA SSD 的 ML310e Gen8 v2(无阵列/jbod - 仅使用控制器使端口 6 可启动),并找到了一种解决方案来阻止 SSD 驱动器在重新启动时显示为失败!这是运行 linux/zfs 的家庭实验室,但我肯定会在生产中使用。

  1. 打开智能存储管理器 (SSA) - 检测到控制器后,我在 POST 时使用 F5 执行此操作。您也可以通过智能配置 (F10) 执行此操作。

  2. 转到“修改控制器设置”并禁用“表面扫描分析优先级”。这将阻止控制器尝试对 SSD 进行表面扫描,从而阻止它们被标记为故障。

  3. 享受第三方 SATA SSD,而不会因启动失败而被禁用。

HP Smart Storage Administrator 用户指南提供了解决方案的提示。似乎surfacescanmode导致了SSD被标记为失败的问题。该手册展示了访问SSA的其他方式 - 我相信可以使用ssacli工具(也许也可以通过串行/iLo?)在每个插槽上关闭surfacescanmode,如果你真的想在其他驱动器上使用它(但是我没有尝试这个,因为我不使用任何阵列控制器功能...而是使用智能监控)

根据 SSA 用户指南,此设置也适用于 Gen9。此外,还适用于 Gen6、Gen7(通过下载映像访问 SSA)- 我怀疑 Gen5 也适用,因为它支持 ssacli。

答案2

但 OCZ SSD不是工作正常......它可能没有正确地向控制器报告其温度。

你的HP ProLiant ML310eGen8 服务器具有嵌入式“动态”Smart Array B120i 控制器在主板上。这是一个“软 RAID”设备。这是服务器中唯一的磁盘吗?从您的问题中看不清楚。如果不是,那么其他磁盘是否已连接?

这个设置有太多限制,我不确定该告诉你什么。

  • 这是一个软件辅助 RAID 控制器。
  • 它的 6 个端口中只有 2 个是 6Gbps。所以我想问服务器里面还有什么。
  • 它仅支持 SATA 设备。
  • 许多情况需要禁用 RAID 功能。
  • 没有缓存。

您的特定问题可能只是 OCZ 驱动器(他们已经破产了)。如果可以,请尝试使用另一个 SSD。

编辑:

我将跳过在此服务器中使用非 RAID SSD,而仅依靠您的(4?)内部磁盘托架。

在 HP ProLiant 世界中,您可以创建多个逻辑驱动器在物理阵列上。因此,使用阵列配置实用程序为您的操作系统开辟一个 120GB 的逻辑驱动器,然后将剩余的空间分配给数据。Smart Array B120i 支持 8 个逻辑驱动器,因此这是处理此问题最顺畅的方式……除非您需要SSD。不过这台服务器好像没必要。

相关内容