GPU 是否可以超过其指定的功耗,或者 nvidia-smi 显示的瓦数是否有噪音?

GPU 是否可以超过其指定的功耗,或者 nvidia-smi 显示的瓦数是否有噪音?

我有时会发现watch -n 0.1 nvidia-smi我的 GPU 的功耗超过了 GPU 的官方限制。这是否意味着 GPU 可能真的超过了其指定的功耗,还是瓦特测量有噪音?

在下面的截图中,第四块 GTX Titan GPU 的功耗为 259W,而nvidia-smi根据Nvidia 规格

在此处输入图片描述

通常情况下,它的功率不会超过 250W,持续时间不会超过几百毫秒。

我在 Ubuntu 14.04.4 LTS x64 上使用 4 个 GTX Titan GPU。

视频:

在此处输入图片描述

答案1

作为一名工程师而不是超级用户来回答这个问题,是的,许多设备可能会在短时间内超出其官方最大限度,而且这种情况经常发生,这就是为什么我们有这样的东西慢熔保险丝。只要这种情况是暂时的,并且不会“过多”发生,保险丝就会愿意允许超额,因为它有机会冷却。如果超额时间太长或太频繁,那么即使是慢熔保险丝也会爆裂。

就你而言,卡上的评级并不是绝对的理论最大值,而是基于大量计算和用例观察得出的官方平均“猜测”。我的朋友,你的用例似乎有点超出这些模型。我很想知道你在这些卡上发生了什么。比特币?渲染?运行整个控制室?

当我观看 gif 时,我发现 GPU 大部分时间都远低于 250,而且至少在提供的数据中,只有最后一个 GPU4 超过了。您可能只是拥有一个边缘 GPU,或者它可能比其他 GPU 做的工作更多。风扇指示器点似乎指示存在热量问题,因此,除非这开始成为问题,并且只要它随着时间的推移保持一致,我就会放心地将其称为好奇心,仅此而已。

相关内容