我有一台 WD_BLACK SN770 SSD NVMe,在负载下运行可能会过热。
为了监控它,我安装了西部数据仪表板并报告 3 个温度:
Libre Hardware Monitor 也报告了 3 种温度:
Western Digital Dashboard 在“状态”仪表板上显示复合温度,因此看起来这是用于检测过热的温度。
问题:“复合温度”、“温度传感器 1”和“温度传感器 2”是什么?我找不到任何解释。我想知道探测器位于 NVMe 设备上的什么位置。
答案1
来源:https://borecraft.com/files/intro-composite-temp-white-paper-345213.pdf
复合温度是一个单一的、标准化的温度值,它考虑来自多个温度传感器的输入...同时向主机报告单个复合温度值以进行热管理。
... 不一定代表 SSD 内任何物理点的实际温度。
复合温度计的工作原理是定期监测多个温度传感器,并将每个当前传感器值与预设的最大值进行比较。
NVMe 建议的 70C 被称为 WCTEMP 或警告综合温度阈值。
您可以看到,它不是传统意义上的温度,而是在主机系统或用户(SSD)达到热极限之前通知主机系统或用户的参考。
NVMe 规范中的更多信息:https://nvmexpress.org/wp-content/uploads/NVMe-NVM-Express-2.0a-2021.07.26-Ratified.pdf
我尝试查找一些 NVMe SSD 的示意图或一些制造商信息,但这似乎非常罕见:
这样就可以选择查看一些 NVMe SSD(本例中为 CORSAIR Force MP510),并尝试定位 SMD 传感器以获取其实际位置,我对一些随机 SSD 进行了此操作。在此示例中,传感器似乎位于 NAND 芯片附近:
对于您的特定 SSD,您需要从两侧拍摄高分辨率图片,或者在显微镜下检查 SSD。为此,数字显微镜可能最容易使用。使用这作为参考示例。
我不确定所有传感器实际上是否都采用单独的 SMD 组件形式。
它仍然留下一个问题:哪个传感器与传感器 1、传感器 2 等相对应。我最好的猜测是(我知道您不是在要求猜测):
Temp - Composite
Temp 1 - Controller
Temp 2 - NAND or board SMT (?)
答案2
复合温度值考虑了磁盘上的多个阈值和传感器,其目的是生成一个数字,让您了解驱动器运行时的相对温度。计算此值的方式是特定于实现的,可能不代表 NVM 子系统中任何物理点的实际温度。此字段的值可用于触发固件中的异步事件。
来源 : 金士顿 SMART 属性详细信息。
这个综合温度值在保修索赔方面具有决定性作用,因此是最重要的数字。
在计算复合温度时,会考虑其他传感器的值。遗憾的是,WD 没有提供磁盘的电路图,因此我们无法知道传感器 1 和 2 的位置。
至于您看到的温度,它们完全在磁盘的操作参数范围内。
这WD Black SN770 SSD 评测 关于负载下的磁盘温度有以下说法:
但是,如果 WD 的 Dashboard 软件正确读取驱动器中的传感器,SN770 在持续负载下确实会变得非常热,至少在启用游戏模式时是这样。在该配置下,在对整个驱动器容量进行两次完整写入后,我们看到峰值温度为 81°C。但是,在禁用游戏模式(这是驱动器的默认配置)的情况下,温度会稍微低一些。在禁用游戏模式的情况下执行相同测试,最高温度为 75°C。在这样的温度下,如果您要将 SN770 插入没有 M.2 散热器的主板上,请确保驱动器上方有良好的气流。在 SN770 上启用游戏模式实际上会禁用任何省电/睡眠功能,因此驱动器始终处于准备就绪状态。打开和关闭该功能对我们运行的基准测试影响甚微(您稍后会看到),但理论上可以最大限度地减少不经常访问存储子系统的游戏中的卡顿或偶尔的故障。
通常情况下,SSD 会报告这样的值,并在 70C 以上开始节流,通常在 75C 左右,随后进入更严重的节流状态,最后达到 85C 附近的最大值。
答案3
快速了解驱动器数据表显示驱动器的指定工作温度:
OPERATING SPECIFICATIONS:
■ Operating Temperature:
32ºF to 185ºF (0ºC to 85ºC)
■ Non-operating Temperature:
-40ºF to 185ºF (-40ºC to 85ºC)
60°C 符合规格。更好的冷却不会对延长使用寿命造成不利影响,因此您只需添加更好的风扇或散热器即可