我有 IBM VM 实例,该实例带有 Tesla v100 32gb gpu,用于机器学习。安装 nvidia 驱动程序后,VM 可以正常工作 10-15 分钟,然后就挂起了。如果我尝试重新登录,VM 根本没有响应。只有通过 VM 管理面板重新启动才有用,但它只能工作 10-15 分钟,情况会重复出现。我成功卸载了驱动程序,但这并没有改变任何东西。有什么提示可能导致此行为吗?
答案1
视频驱动程序安装后,系统电源管理激活睡眠模式。检查命令:
systemctl status sleep.target
结果:
- sleep.target - 睡眠
- 已加载:已加载(/lib/systemd/system/sleep.target;静态;供应商预设:已启用)
- 活跃:不活跃(死亡)
- 文档:man:systemd.special(7)
关闭睡眠的命令:
sudo systemctl mask sleep.target suspend.target hibernate.target hybrid-sleep.target
结果:
- 已创建符号链接 /etc/systemd/system/sleep.target → /dev/null。
已创建符号链接 /etc/systemd/system/suspend.target → /dev/null
。已创建符号链接 /etc/systemd/system/hibernate.target → /dev/null。
已创建符号链接 /etc/systemd/system/hybrid-sleep.target → /dev/null。