安装 nvidia 驱动程序后,Ubuntu 20.04 VM 实例挂起

安装 nvidia 驱动程序后,Ubuntu 20.04 VM 实例挂起

我有 IBM VM 实例,该实例带有 Tesla v100 32gb gpu,用于机器学习。安装 nvidia 驱动程序后,VM 可以正常工作 10-15 分钟,然后就挂起了。如果我尝试重新登录,VM 根本没有响应。只有通过 VM 管理面板重新启动才有用,但它只能工作 10-15 分钟,情况会重复出现。我成功卸载了驱动程序,但这并没有改变任何东西。有什么提示可能导致此行为吗?

答案1

视频驱动程序安装后,系统电源管理激活睡眠模式。检查命令:

systemctl status sleep.target

结果:

  • sleep.target - 睡眠
    • 已加载:已加载(/lib/systemd/system/sleep.target;静态;供应商预设:已启用)
    • 活跃:不活跃(死亡)
      • 文档:man:systemd.special(7)

关闭睡眠的命令:

sudo systemctl mask sleep.target suspend.target hibernate.target hybrid-sleep.target

结果:

  • 已创建符号链接 /etc/systemd/system/sleep.target → /dev/null。
    已创建符号链接 /etc/systemd/system/suspend.target → /dev/null
    。已创建符号链接 /etc/systemd/system/hibernate.target → /dev/null。
    已创建符号链接 /etc/systemd/system/hybrid-sleep.target → /dev/null。

相关内容