问题
我在这个论坛上看到过很多类似的问题,也尝试过很多提出的解决方案,但似乎都没有效果:c
我尝试按照 CUDA 安装指南安装 CUDA。此过程要求安装 CUDA 工具包,在此过程中我必须更新 nvidia 驱动程序。
我尝试从网站更新我的 nvidia 驱动程序以适应我的配置。我有一台 NVIDIA RTX4000 ADA,我正在使用一台装有 Ubuntu 22.04 的 lunix 电脑。网站上说最新的驱动程序是 nvidia driver-550。我下载了文件并尝试通过运行以下命令从终端运行安装:
./NVIDIA-Linux-x86_64-550.67.run
。但是有一个警告提示说我应该从 ubuntu 应用程序进行更新“软件和更新”。所以我取消了更新,然后转到此应用程序并选择了推荐的驱动程序。我重新启动了电脑,现在每当我尝试运行时nvidia-smi
都会出现以下错误:
NVIDIA-SMI 失败,因为它无法与 NVIDIA 驱动程序通信。请确保已安装并运行最新的 NVIDIA 驱动程序。
我尝试重新安装驱动程序,但我进一步破坏了设置,因为现在当我打开“软件和更新”我甚至没有得到推荐的选项......
抱歉,我不太懂技术,我应该从出厂设置恢复我的电脑吗,或者可以解决这个问题吗?
调试输出
sudo lshw -C display
*-display
description: VGA compatible controller
product: NVIDIA Corporation
vendor: NVIDIA Corporation
physical id: 0
bus info: pci@0000:01:00.0
logical name: /dev/fb0
version: a1
width: 64 bits
clock: 33MHz
capabilities: pm msi pciexpress vga_controller bus_master cap_list fb
configuration: depth=32 latency=0 mode=1920x1200 visual=truecolor xres=1920 yres=1200
resources: iomemory:600-5ff iomemory:640-63f memory:96000000-96ffffff memory:6000000000-63ffffffff memory:6400000000-6401ffffff ioport:3000(size=128) memory:97080000-970fffff
sudo dkms status
nvidia/550.54.14, 6.1.0-1036-oem, x86_64: installed
我已尝试过(更新)
尝试以多种方式重新安装驱动程序,甚至从 root shell 重新安装(Nvidia 驱动程序在更新时损坏 - 无法重新安装) 。 已尝试sudo ubuntu-drivers autoinstall
过sudo reboot
。
我感觉我正在尝试随机的东西,因为我真的不知道到底是什么坏了……
答案1
今天使用 550.67 驱动程序时遇到了同样的问题——但在 Pop OS 22.04 上。我之前运行过 CUDA,但想更新以使 TensorFlow 正常工作。我的显卡是 GTX 1050... 我可以在清理 470 版本后运行。没有提供 CUDA。其他的我到现在还没试过。
您可以这样检查您的驾驶历史记录,以查明您之前的驾驶记录:
#!/bin/bash
log_path="/var/log"
grep -h "nvidia-driver" $log_path/dpkg.log* | grep "install " | sort -u