我有一台无头台式计算机(无屏幕/无键盘)用作机器学习训练服务器(使用 GPU)。我通过 SSH 从我的另一台计算机(笔记本电脑)连接它。
什么时候:
我使用 Nvidia GTX 650 作为主板上连接的唯一显卡启动计算机,它似乎无法启动,并且我无法通过 SSH 连接计算机
我用 Nvidia GTX 650 + 旧的 ATI Radeon 显卡启动计算机(我的 MB 上有两个 PCI-express 插槽),然后它启动,我可以通过 SSH 进行连接。
注意:Nvidia 的驱动程序已安装(apt-get install nvidia-315
),并且检测到(第二种情况),Tensorflow 可以成功使用它,因此这意味着问题不是来自缺少驱动程序。
阻止 Ubuntu 16.04 服务器以 Nvidia GTX 650 作为唯一显卡启动的问题可能是什么?
答案1
也许您已经安装了具有双卡配置的笔记本电脑,然后显示配置(X)已经记住了该配置。
你可以做 :
- 检查日志文件(系统、X)并分析未连接 ATI 卡时发生的情况。服务器是否启动并放置一些日志
- 更新或创建 xorg.conf,这有点棘手。
答案2
这似乎是一个奇怪的主板+显卡问题(MB:M4A79XTD EVO)。我还没有真正解决这个问题,但这里是测试的描述,以供将来参考:
Nvidia GTX 650 Ti 单独位于 PCIEx16_1 插槽上:甚至无法启动!
同一插槽上单独的旧 ATI:启动正常
旧 Radeon HD 5770 位于同一插槽:启动正常Nvidia GTX 650 Ti 单独安装在插槽 PCIEx16_2 上:可以
旧版 ATI 单独安装在同一插槽上:可以插槽 PCIEx16_1 上的 Nvidia GTX 650 Ti
+ 插槽 PCIEx16_2 上的旧 ATI
=> 启动正常
可能的原因:
- 我怀疑我的 PCIEx16_1 插槽在 x16 模式下无法正常工作。当有两个显卡时,每个显卡可能都被强制为 x8(因此它可以工作)。
无论如何,旧显卡可能使用 x8,这可以解释为什么它可以与旧显卡一起使用,即使在 PCIEx16_1 插槽上也是如此
解决方案:
- 刷新新的 BIOS/更新(未经测试)
- 只使用 PCIEx16_2,忘记 PCIEx16_1(本来,我想避免这种情况,因为 PCIEx16_1 在计算机机箱中的位置更有利于散热)
- 在 PCIEx16_1 中使用 Nvidia,但在 PCIEx16_2 中保留旧的(无用的)显卡只是为了强制 x8,因此它可以工作。