我最近关注本指南由 TensorFlow/Google 介绍如何安装所有需要的驱动程序/库,以便将 Tensorflow 与我的 GPU 一起使用。这是在 Ubuntu 18.04 上运行的 NVIDIA 1080Ti。之前,我使用的是专有的 430(我认为)驱动程序,它由 Ubuntu 自动管理。
执行以下命令后:
# Add NVIDIA package repositories
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo apt-get update
wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt install ./nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt-get update
# Install NVIDIA driver
sudo apt-get install --no-install-recommends nvidia-driver-410
# Reboot. Check that GPUs are visible using the command: nvidia-smi
并重新启动后,我遇到了以下情况:
Ubuntu 总是在启动时冻结,不接受鼠标移动/键盘按下。虽然我的自动登录可以正常工作(并且顶部栏中的时间可以正确同步),但此后我无法执行任何操作。
我尝试过的:
- 我能够进入带网络连接的恢复模式。在那里,我安装了软件包
nvidia-driver-430
并自动删除了所有较旧的 NVIDIA 驱动程序。然而,我仍然面临完全相同的问题。 - 添加
nomodeset
内核选项也不能解决问题(Ubuntu 在启动时仍然冻结)。
我的问题:我怎样才能阻止 Ubuntu 冻结?
- nomodeset 不起作用
- 因此我必须进入恢复模式
- Ctrl++无效AltF1
答案1
我能够在恢复模式下通过删除 NVIDIA 驱动程序来解决问题。
在恢复模式下运行以下命令:
# Enable networking and check for updates
sudo service network-manager start
sudo apt update
# Reinstall Ubuntu-Desktop, install unity
sudo apt install --reinstall ubuntu-desktop
# Remove NVIDIA
sudo apt remove --purge nvidia-driver-<YOUR NUMBER HERE>
# Reboot
sudo shutdown -r now
之后,您可以使用标准终端并运行sudo apt install nvidia-driver-<YOUR NUMBER HERE>
以重新安装 NVIDIA 驱动程序