Supermicro OEM (HPE) GPU 服务器初始化卡住 91

Supermicro OEM (HPE) GPU 服务器初始化卡住 91

我刚刚设置了 HPE SX40(Supermicro SYS-1029GQ-TVRT)。

系统启动时卡在“正在初始化...91”上。我尝试了一些粗暴的测试,例如删除所有内存,并得到了相关的错误消息。

因此,1)移除所有 pcie 卡(包括 NVIDIA SXM2 适配器板)并启动 -> 没有运气

2)按照常见问题解答重置 CMOS(https://www.supermicro.com/support/faqs/faq.cfm?faq=18922)-> 没有运气

3)直接更新 bios (https://www.supermicro.com/support/faqs/faq.cfm?faq=20491)-> 根本没运气。

任何评论Supermicro 停留在 91 也不起作用。

有人知道 91 对于 X11DGQ(超微制造的主板)到底意味着什么吗?

我对 gpu 的数量感到怀疑(我只有一个 V100 gpu,因此按照 HP 配置的两个卡(插槽 3 和插槽 2,用于 cpu1 和 cpu2)连接到 SXM2 插槽 3,但对于 1 仍然没有意义),因为在移除所有 pcie 连接后出现相同的 91 错误。

答案1

以上所有尝试都没有成功,但经过三天的努力,我决定将其全部拆开,然后重新组装。

它启动了!我发现 cpu2 出了问题。cpu 问题也可能导致 91!因为它与 pcie 通道有关:)

相关内容