安装 CUDA 后无法登录 Ubuntu

安装 CUDA 后无法登录 Ubuntu

我想在我的 Ubuntu 16.04 中安装 CUDA 8.0。首先,我使用以下命令停止了 X 服务器:

sudo /etc/init.d/lightdm stop

然后我从Nvidia官方网站安装了CUDA 8.0。(显卡驱动程序与CUDA一起安装)。

当我重新启动 Ubuntu 时,它陷入了登录循环。我该怎么办?

答案1

在做任何其他事情之前,请先在一张纸上写下这两个摆脱登录循环的命令,这样如果您在启动时陷入登录循环,您将能够采取一些措施。

  • sudo chown $(whoami):$(whoami) .Xauthority
  • sudo dpkg-reconfigure lightdm

同时记下链接这个答案其中有关于如何摆脱登录循环的更详细信息。


您的问题可能是由 NVIDIA 专有图形驱动程序引起的,该驱动程序与官方 NVIDIA CUDA 下载网站上的 NVIDIA CUDA 工具包捆绑在一起。因此,请尝试使用默认 Ubuntu 存储库中的 NVIDIA 专有图形驱动程序和 NVIDIA CUDA 工具包。

默认 Ubuntu 16.04 存储库中的 NVIDIA CUDA Toolkit 软件包是 7.5 版,它不如官方 NVIDIA CUDA 下载网站上的 NVIDIA CUDA Toolkit 8.0 软件包那么新,但它更稳定、更可靠。默认 Ubuntu 16.04 存储库中的专有 NVIDIA 图形驱动程序也是如此,NVIDIA-346或者NVIDIA-352或按照以下说明的第 4 步推荐为您的硬件安装任何其他 nvidia 驱动程序版本。

  1. Ctrl使用键盘组合键+ Alt+从登录屏幕调出纯文本虚拟控制台,F3然后您将获得一个纯文本虚拟控制台,其中显示登录提示。使用您的用户名和密码在登录提示符下登录控制台。

  2. 运行此命令显示 cuda 包列表,这将帮助您识别所安装的 NVIDIA CUDA Toolkit 包的名称。

    dpkg-query -l cuda*  
    
  3. 从纯文本控制台卸载 NVIDIA 专有图形驱动程序。你用于从 NVIDIA 网站安装 NVIDIA CUDA Tookit 的文件应该命名为cuda-repo-ubuntu1604-8-0-本地-ga2_8.0.61-1_amd64.deb。如果是,则卸载它的命令是:

    sudo dpkg -P cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64
    sudo reboot 
    

    如果您用于安装 NVIDIA CUDA Toolkit 的文件名称不同,或者您安装了不同的文件,则在上述命令中更改名称。如果您安装了cuda_8.0.61_375.26_linux.运行文件(runfile(local)),然后注释,以便我可以更改命令以匹配此文件。上述命令中的文件名称必须与您安装的 NVIDIA CUDA Toolkit 文件的名称完全匹配。

  4. 重启后,卸载之前安装的所有 CUDA 软件包。如果没有 NVIDIA 网站上的 NVIDIA 专有驱动程序,它们将无法正常工作,因此您必须从默认的 Ubuntu 存储库安装 CUDA 软件包。

  5. 确定系统推荐的专有图形驱动程序。打开终端并输入:

    ubuntu-drivers devices  
    
  6. 安装推荐的 NVIDIA 专有图形驱动程序并重新启动。

    sudo apt install <package-name-of-the-recommended graphics-driver> 
    sudo reboot 
    
  7. 安装 CUDA 包。打开终端并输入:

    sudo apt install libcudart7.5 nvidia-cuda-toolkit  
    

PS 我希望您在从官方 NVIDIA CUDA 下载网站安装 CUDA 包后没有更改终端中的任何 PATH 变量。如果您确实从终端更改了 PATH 变量,请发表评论并告知我,以便我可以告诉您如何将其改回。

答案2

  • Ctrl+ Alt+F3切换到不同的终端

  • 登录

  • 卸载 nvidia* 软件包

sudo apt-get purge nvidia-*

  • 之后,安装 nvidia-346

安装 nvidia-346

  • 重启

答案3

现在我在 Ubuntu 16.04 中成功安装了 CUDA 8.0。我认为主要问题是图形驱动程序。

  1. 我重新安装了 Ubuntu,因为即使删除 nvidia 驱动程序和 cuda 后我仍然无法登录。
  2. 我通过 将图形驱动程序更改为 nvidia 驱动程序Additional Drivers。在我的 ubuntu 中,它是NVIDIA binary driver-version 367.57 from nvidia-367(proprietary,tested)

  3. 我按照这个安装 cuda 8.0指导cuda 中没有 nvidia 驱动程序。

答案4

我还没有尝试过 ubuntu 16.04,但我在 ubuntu 10.04 上有同样的经历,问题通过以下方式解决:清除 gdm
请按照 cuda 安装指南安装所有依赖项,并在运行 cuda 安装程序之前执行以下操作:

apt-get 清除 gdm

相关内容