诊断系统持续识别 SATA 驱动器但拒绝识别 SAS 驱动器或其替代品?

诊断系统持续识别 SATA 驱动器但拒绝识别 SAS 驱动器或其替代品?

我已经做了相当多的故障排除,但我完全不知道到底发生了什么。

硬件/平台

  • Supermicro X10SRi-F 主板
  • EVGA 850W G2 PSU(Jonnyguru.com 上电源质量评级最高的电源之一)
  • 128GB Crucial DDR4 RDIMM
  • LSI 9211-8i PCIe HBA 已刷新至最新的 P20-IT(来自 LSI/Avago 网站)
  • 8087 至四 SAS 连接器电缆(新:看到这张照片(电源侧接受 SATA PSU 连接器的电缆类型)
  • 希捷 6TB SAS 硬盘(新品:ST6000NM0054)
  • 其他各种 Seagate 3TB - 6TB SATA 硬盘(测试目的)

迄今为止的问题/故障排除

这是正在设置的新服务器,因此所有组件都是新的,尽管有些组件之前已经测试过了。

启动时,HBA 无法识别或报告 6TB SAS 驱动器(无论是通过主 BIOS 还是通过其自己的 OROM -> SAS 拓扑),并且 6TB 驱动器处于冷态且未旋转。未连接其他驱动器。系统的其余部分运行良好,因此从表面上看,问题仅限于一个或多个坏的 HBA、坏的电缆或坏的驱动器。

迄今为止的故障排除步骤:

  1. 使用四芯电缆上的不同终端器连接 6TB SAS 驱动器,并将四芯电缆连接到两个 8087 端口。没有变化 - 意味着问题不在于某个特定的终端器或端口。
  2. 使用相同的电缆连接各种 Seagate 3TB-6TB SATA 硬盘(相同制造商和类似的现代系列,以消除细微的兼容性问题)。在启动时,在两个 8087 端口和所有 4 个终端器上以及在多次重启后,所有硬盘均能正常识别、报告和旋转 - 意味着 HBA 和电缆都工作正常,至少对于 SATA 而言。(如果它们对 SATA 完美工作但对 SAS 不完美,那就奇怪了。)
  3. 保持相同的连接,但用 6TB SAS 驱动器替换 SATA 驱动器,其他任何内容均未更改。与之前一样,6TB SAS 驱动器未被 HBA 识别或报告,并且未启动。
  4. 在基于 ASUS 的台式机上使用不同的卡和平台 m- LSI 9260-8i RAID 控制器进行了完全相同的尝试。同样,所有 SATA 驱动器都立即被识别并启动,但 6TB SAS 驱动器却没有启动。
  5. 勉强得出结论,无论可能性有多小,最有可能的问题是 6TB SAS 驱动器 DOA 并对其进行了 RMA。(“勉强”是因为我以前从未真正遇到过 DOA,驱动器通常是可靠的,如果它坏了,那么更常见/预期的情况是它至少被识别但无法正常工作。我只是无法想象比完全 DOA 更可能的问题。)
  6. 刚刚收到保修更换件 - 并且与替代品的症状完全相同:(a) 当 6TB SAS 驱动器和任何 SATA 驱动器连接到 2 个终端器且系统启动时,SATA 驱动器会立即被识别、报告并启动,而 6TB SAS 驱动器则保持冷却和静止。 (b) 当 6TB SAS 和任何 SATA 驱动器连接到另一台 ASUS 台式机中的 9260-8i RAID 卡时,SATA 驱动器同样会立即被识别,但 6TB SAS 驱动器保持冷却。
  7. 最后一步,重新阅读 9211-8i HBA 用户指南,以防第一次遗漏任何内容,并重新检查 BIOS。找不到任何似乎可以解释这一点的内容,或任何声明除非/直到 <某些操作/内容>,否则 SAS 驱动器将无法被识别。

第一次真的不相信这是 DOA。现在绝对不相信这是 DOA。但如果不是,那它是什么,我可能错过了什么?

我已经测试了组件链中的所有东西(据我所知),HBA 没有太多可能出错的 OROM 接口,也没有识别 SATA/SAS/两者的选项,或者类似的东西,并且在两种情况下,主 PC/服务器都只将检测留给 HBA/RAID 卡。我在两个完全不同的平台上进行了测试,使用了两种不同型号的控制卡,分别使用了 SAS 和 SATA 驱动器,但我完全不知所措。

(注意:我的能力略有限制,因为我刚开始从 SATA 过渡到 SAS,目的是用 SAS 替换磨损的 SATA,所以目前我没有其他 SAS 磁盘或电缆可供测试,否则我也会这样做。但我想我可能已经通过在不同 SATA/SAS 上测试卡+电缆来解决这个问题)

更新为了获得更准确的标题来帮助他人,现在获得了更多信息。请参阅答案。

答案1

我与德国 LSI(现为 Avago)的存储技术支持人员进行了交谈。他们认为,如果两台不同机器上的两种不同类型的“已知良好”控制器都识别出所有 SATA 驱动器,但无法识别此 SAS 驱动器(在任何端口和连接器上),则很可能是该驱动器的问题。

他们还建议进行进一步测试 - 仅连接驱动器的电源侧(而不是 HBA/主板/数据线)并打开服务器。(他警告我这“听起来很疯狂”!)显然,与 SATA 一样,如果未连接数据侧,SAS 驱动器在首次通电时会旋转起来(我不知道这一点,想知道交错启动是如何运作的?),提供了一个非常好的测试,该测试仅依赖于 PSU 和驱动器的电源供给,而不依赖于其他任何东西。

果然,SATA 驱动器全部启动,但这个驱动器却不启动。他觉得这足以“几乎肯定”这是第二个坏驱动器,尽管可能性不大,但不用花钱。序列号也几乎与原始坏驱动器相同(1 位数字变化);因此他还建议与制造商联系,并询问他们是否有任何其他类似的报告,因为这可能是一批坏驱动器。

2017 年 4 月更新:

根据网上的一个帖子,我一度认为问题是需要禁用 LSI 9211 BIOS。我禁用了 BIOS,它确实工作了……但后来当我移动盒子时,它停止工作了,我不明白为什么。我把这个信息带回给 LSI 技术支持,他们说 BIOS 不可能是问题所在,或者禁用它可能有帮助。他们认为移动盒子很可能会解开一根偶然工作的电缆,使它重新无法工作。

他们建议尝试新的“正向”或“扇出”电缆,特别是 Adaptec(从侧面看,因为它是竞争对手!!),它比大多数 SAS 电缆更可靠。他们说电缆是否正确并不总是很清楚或有标记,因此要仔细检查。

所需的确切 SAS 电缆将根据 HDD 和卡的接口而有所不同。9211 有一个 SFF-8087 连接,而我的 HDD 有一个 SFF-8082 连接(看起来有点像 SATA,但电源和数据端口连接在一起)。

我怀疑是不是电缆出了问题(因为电缆在电气性能相似的 SATA 上工作正常),但还是联系了 Adaptec,他们表示,要找到合适的电缆可能非常困难,因为他们无法确定到底需要哪种电缆。他们检查了卡规格和硬盘规格,并推荐了亚马逊上的 2275300-R,令我惊讶的是,它第一次就成功了,所以我想他们一定知道自己在说什么。

答案2

事实上,造成这种问题的真正原因是 SATA/SAS 电源标准的变化。问题出在引脚 3 上。

使用较新的 SAS 驱动器(2016 年后制造)时,使用 Molex 式电源将解决此问题。

因此,无论是电缆(除非使用 Molex 供电)、HBA 还是驱动器,都指向这一点。很有趣吧?

https://www.hgst.com/sites/default/files/resources/HGST-Power-Disable-Pin-TB.pdf

答案3

不确定您是否尝试用 sas 替换现有阵列中的 sata 驱动器,但如果是这样则不起作用,您无法在活动阵列中用 sas 替换 sata 或用 sata 替换 sas,您必须备份该阵列,删除它,移除驱动器并替换,然后重新创建阵列并从备份中恢复。可能把它放在一边更容易。

相关内容