dell poweredge pcie 训练错误,怎么办?

dell poweredge pcie 训练错误,怎么办?

在告诉服务器重新启动后,它现在显示“PCle 训练错误:内部存储插槽”,然后下一行是“系统已停止!”。它不会启动。

最近更换了一个发生故障的 scsi 热插拔驱动器,但它重建得很好并且已经正常运行了一周。

有任何想法吗?

答案1

有相同的“PCle 训练错误:内部存储插槽”。我更换了 PCIe RAID 控制器上两个电容器中的一个,该电容器显示出故障迹象(扩展外壳)。1500uf @ 6.3V。系统现在启动并运行了 24 小时以上。

答案2

我们设法通过关闭它、打开它、检查提升板/pci 等卡连接并重新安装它们来启动它。

我们还尝试了多次关闭电源、重新启动并移除较新的驱动器。

答案3

dell poweredge 服务器仅配置了 PCIe Gen 3。如果您的卡是 Gen2 或 Gen1,那么您将面临训练错误。

检查您的 PCIe 配置。如果是 FPGA 配置的 PCIe,则检查配置和位文件,它们应严格仅限于 Gen3。

我们也遇到了这个问题,最后我的朋友找到了它。

答案4

我在多台 Dell 11G (R610) 和 12G (R620/R720) 系统上都遇到过这个问题。虽然我不确定问题是什么,但似乎只是硬件兼容性问题。

就我的情况而言,系统在第一次通电时通常可以正常启动,但如果没有循环电源就进行热重启将会导致错误。有一段时间我只是确保服务器循环通电而不是重新启动,但最终还是需要某种替换才能修复。

我收到的一个错误是由于安装 USB3.0 PCIe 卡引起的。将其移至其他插槽没有帮助,但将其替换为使用不同芯片组的 USB3.0 卡解决了问题。在另一种情况下,将 Dell R610 的 Intel X520 10GbE 卡安装到 R620 中导致了问题,但将 Intel 卡替换为 Silicon Image 的卡(使用不同的 Intel 芯片组)解决了问题。这非常令人惊讶,因为 Dell 固件支持 Intel X520(R620 生命周期管理器甚至为我进行了固件更新),但它仍然导致 PCIe 训练错误。

最终似乎归结为这一点 - 如果您遇到 PCIe 训练错误,请用其他型号替换有问题的卡。

相关内容