我正在尝试在我的服务器上设置 CUDA 并为我的 GT 710 安装适当的 NVIDIA 驱动程序,以便我可以在其上执行诸如训练 RNN 模型之类的操作,但它们似乎都是为台式机设计的。
sudo ubuntu-drivers devices
列出以下内容:
== /sys/devices/pci0000:00/0000:00:03.1/0000:07:00.0 ==
modalias : pci:v000010DEd0000128Bsv00001043sd000085E7bc03sc00i00
vendor : NVIDIA Corporation
model : GK208B [GeForce GT 710]
driver : nvidia-driver-460-server - distro non-free
driver : nvidia-driver-390 - distro non-free
driver : nvidia-driver-460 - third-party non-free recommended
driver : nvidia-driver-450 - third-party non-free
driver : nvidia-driver-418-server - distro non-free
driver : nvidia-driver-450-server - distro non-free
driver : xserver-xorg-video-nouveau - distro free builtin
但是,任何这些驱动程序的安装总是会失败,并且会尝试安装 GNOME 之类的东西,而我想要的只是驱动程序。
如何在 Ubuntu 服务器上正确安装 NVIDIA 驱动程序?
答案1
正如我最初在问题中所述,尝试在我的 Ubuntu 20.04 服务器操作系统上安装驱动程序没有成功(也许是一个错误,我不确定),但我详细说明了我在下面采取的具体步骤,这些步骤对我有用。
让驱动程序工作后,我就可以按照标准方式安装 CUDA。
删除所有以前的安装(*重要*)
我之前尝试安装驱动程序apt
,但失败了,所以我必须确保删除所有以前的 NVIDIA 软件包。我运行了以下命令。
sudo apt-get purge nvidia*
sudo apt-get autoremove
下载驱动程序
对我来说,我选择了 460.67 驱动程序,这是撰写本文时的最新生产分支版本。我运行了以下命令:
cd ~/
wget http://us.download.nvidia.com/XFree86/Linux-x86_64/460.67/NVIDIA-Linux-x86_64-460.67.run
安装依赖项
执行命令sudo apt-get install build-essential gcc-multilib dkms
。
执行运行文件
cd ~/
sudo chmod +x NVIDIA-Linux-x86_64-460.67.run
sudo ./NVIDIA-Linux-x86_64-460.67.run
按照安装程序给出的所有提示进行操作。
在安装过程中,您可能会收到类似以下的警告。完全可以忽略它。
WARNING: nvidia-installer was forced to guess the X library path '/usr/lib' and X module path '/usr/lib/xorg/modules'; these paths were not queryable from the system. If X fails to find the NVIDIA X driver module, please install the `pkg-config` utility and the X.Org SDK/development package for your distribution and reinstall the driver.
检查安装
您可以通过运行命令来检查所有内容是否已正确安装nvidia-smi
,该命令应返回类似的输出:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 460.67 Driver Version: 460.67 CUDA Version: 11.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 GeForce GT 710 On | 00000000:07:00.0 N/A | N/A |
| N/A 45C P8 N/A / N/A | 0MiB / 2000MiB | N/A Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
如果您看到该信息,则表示您的 NVIDIA 驱动程序已正确安装!