我正在尝试重置 Azure 虚拟机的 GPU(在运行 Ubuntu 16.04.1NVIDIA GPU Cloud Image
上运行Standard NV6
),以获得深度学习算法的可重现结果。我发现此 NVIDIA 帮助页面,这解释了我无法重置 DGX-1 服务器的单个 GPU:
对于 DGX-1 和 DGX-1V 平台,单个 GPU 无法重置,因为它们是通过 nvlink 链接的,所以必须同时重置所有 GPU。
如何查找我的 Azure 计算机上的 GPU 是否属于 DGX-1 服务器?
答案1
您应该能够查询操作系统来告诉您拥有什么设备。您没有在问题中列出操作系统,因此我假设它是 Ubuntu。以下是您可以尝试的几个命令。
lspci -vnn | grep VGA -A 12
lshw -numeric -C display
有关 N 系列的 GPU 信息可以在这里找到: https://docs.microsoft.com/en-us/azure/virtual-machines/windows/sizes-gpu