2 天前买了一块 rtx 2080ti,之前用的是两块 gtx 1080,运行我的 tensorflow 程序没有问题,换成 rtx 2080ti 后,系统找不到该设备的驱动程序,lshw 显示以下内容
*-显示未认领 描述:VGA兼容控制器 产品:NVIDIA Corporation 供应商:NVIDIA Corporation 物理 ID:0 总线信息:pci@0000:01:00.0 版本:a1 宽度:64 位 时钟:33MHz 功能:pm msi pciexpress vga_controller cap_list 配置:延迟=0 资源:内存:de000000-deffffff 内存:c0000000-cfffffff 内存:d0000000-d1ffffff ioport:e000(size=128)内存:c0000-dffff
我尝试从 PPA 手动安装一些驱动程序,但没有任何反应。
这是我的电脑问题还是它确实尚未得到支持。
我的系统版本是18.04
谢谢
答案1
我写了一个完整的文章关于如何在 Ubuntu 上为 RTX 2080 系列 GPU 安装驱动程序和 cuda,主要是因为这对某些(大多数?)用户来说可能是一项耗时的任务。建议您按照以下答案阅读本文。
我发现Ubuntu-16.04
和都存在同样的问题18.04
。Ubuntu-16.04
机器没有找到正确的 Nvidia 驱动程序,并且它一直在使用开源 Nouveau 显示驱动程序。因此,您需要从英伟达。
现在按如下方式安装驱动程序。
1) cd Downloads/
2) ls
#(NVIDIA-Linux-x86_64–410.57.run #output of ls)
3) chmod +x NVIDIA-Linux-x86_64–410.57.run
#(to get permission to execute the run file)
4) sudo ./NVIDIA-Linux-x86_64–410.57.run --no-x-check
笔记: --no-x-check
标志很重要。否则,您必须禁用x-server
并从 GUI 中注销。
安装驱动程序后,重新启动机器并使用终端上的命令验证安装nvidia-smi
。它将显示 GPU 和已安装的驱动程序信息。
下一步是安装 cuda,有时可能会很麻烦。您必须从 GUI 注销并在终端上执行所有操作。
从此处下载相关的 cuda 运行文件关联.然后创建一个名为blacklist-nouveau.conf在您的主目录中,并将以下行添加到此文件。
blacklist nouveau
options nouveau modeset=0
现在我们必须按 (Ctrl+Alt+F1)安装 cuda。输入您的用户名和密码进入终端。
现在请按照下列步骤操作。
1) sudo service lightdm stop
2) sudo -i
3) sudo cp /home/avin/blacklist-nouveau.conf /etc/modprobe.d
#change avin with your user name
4) sudo update-initramfs -u
5) exit
6) cd Downloads/
7) md5sum cuda_10.0.130_410.48_linux.run #(Optional)
8) sudo sh cuda_10.0.130_410.48_linux.run
将出现 Cuda 安装向导。按照文章中明显的步骤进行操作。安装完成后,reboot
在此终端上运行。
机器重新启动后,将 cuda 路径添加到.bashrc
。
1) sudo gedit ~/.bashrc
2) Add following 2 lines at the end of the .bashrc file
export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
3) source ~/.bashrc
现在nvcc -V
在终端上运行,它应该产生如下输出。
现在已经安装了驱动程序和 cuda,您可能想要安装 tensorflow gpu 版本。这里是完成同一任务的很好的教程。
答案2
我刚刚遇到了完全相同的问题,现在我正在运行张量流模型来测试它,它看起来不错
我需要做的就是从 Nvidia 网站安装驱动程序并使用 sudo 运行它。
这是链接 https://www.geforce.com/drivers
我还没有对性能进行任何基准测试,但一切似乎都很好
这种方法的一个非常严重的缺点是每次更新内核时您都必须重新安装驱动程序!