Linux 无法仅使用 Nvidia GTX 启动

Linux 无法仅使用 Nvidia GTX 启动

我有一台无头台式计算机(无屏幕/无键盘)用作机器学习训练服务器(使用 GPU)。我通过 SSH 从我的另一台计算机(笔记本电脑)连接它。

什么时候:

  • 我使用 Nvidia GTX 650 作为主板上连接的唯一显卡启动计算机,它似乎无法启动,并且我无法通过 SSH 连接计算机

  • 我用 Nvidia GTX 650 + 旧的 ATI Radeon 显卡启动计算机(我的 MB 上有两个 PCI-express 插槽),然后它启动,我可以通过 SSH 进行连接。

注意:Nvidia 的驱动程序已安装(apt-get install nvidia-315),并且检测到(第二种情况),Tensorflow 可以成功使用它,因此这意味着问题不是来自缺少驱动程序。

阻止 Ubuntu 16.04 服务器以 Nvidia GTX 650 作为唯一显卡启动的问题可能是什么?

答案1

也许您已经安装了具有双卡配置的笔记本电脑,然后显示配置(X)已经记住了该配置。

你可以做 :

  • 检查日志文件(系统、X)并分析未连接 ATI 卡时发生的情况。服务器是否启动并放置一些日志
  • 更新或创建 xorg.conf,这有点棘手。

答案2

这似乎是一个奇怪的主板+显卡问题(MB:M4A79XTD EVO)。我还没有真正解决这个问题,但这里是测试的描述,以供将来参考:

  • Nvidia GTX 650 Ti 单独位于 PCIEx16_1 插槽上:甚至无法启动!
    同一插槽上单独的旧 ATI:启动正常
    旧 Radeon HD 5770 位于同一插槽:启动正常

  • Nvidia GTX 650 Ti 单独安装在插槽 PCIEx16_2 上:可以
    旧版 ATI 单独安装在同一插槽上:可以

  • 插槽 PCIEx16_1 上的 Nvidia GTX 650 Ti
    + 插槽 PCIEx16_2 上的旧 ATI
    => 启动正常

可能的原因:

  • 我怀疑我的 PCIEx16_1 插槽在 x16 模式下无法正常工作。当有两个显卡时,每个显卡可能都被强制为 x8(因此它可以工作)。
    无论如何,旧显卡可能使用 x8,这可以解释为什么它可以与旧显卡一起使用,即使在 PCIEx16_1 插槽上也是如此

解决方案:

  • 刷新新的 BIOS/更新(未经测试)
  • 只使用 PCIEx16_2,忘记 PCIEx16_1(本来,我想避免这种情况,因为 PCIEx16_1 在计算机机箱中的位置更有利于散热)
  • 在 PCIEx16_1 中使用 Nvidia,但在 PCIEx16_2 中保留旧的(无用的)显卡只是为了强制 x8,因此它可以工作。

相关内容