我正在一台装有 GTX980s 和 CentOS 6.6 的机器上安装 CUDA 工具包和 nVidia 驱动程序。根据 nVidia 的说法,我需要一个不同于其开发者网站上通常提供的 CUDA 工具包(6.5-19 而不是 6.5-14)。此版本的工具包安装驱动程序版本 340.19(这没有意义,因为 340.22 增加了 GTX980 支持)。现在,当我从 CUDA 安装驱动程序时,卡显然无法被识别(nvidia-smi 抱怨没有驱动程序正在运行)。我尝试安装最新的可用驱动程序(340.65),但它似乎与 CUDA 提供的版本不兼容。我尝试先安装驱动程序,然后安装 CUDA。但 CUDA 驱动程序与安装的驱动程序仍然存在相同的不兼容问题。
有没有什么办法可以解决这个问题?
谢谢
解决方案:
仅安装 CUDA 工具包(不安装驱动程序)并安装正确的驱动程序。
答案1
我在 CentOS 上也遇到了同样的问题。显然 CentOS 6.6 对 CUDA-6.5 的内核版本支持存在问题。您是否尝试过结合使用 nouveau 和 CUDA 6.5?
答案2
我发现可以通过单独安装 CUDA6.5 驱动程序来解决这个问题。为此,我使用网站上的软件包而不是 nvidia RHEL repo 来安装 CUDA。这为您提供了不安装驱动程序的选项。使用驱动程序版本 343.36 和 CUDA 版本 6.5、V6.5.16 即可运行。