Kubuntu 的磁盘监控功能最近(最近几周)开始在启动时向我发出有关我的 NVMe M.2 SSD(Crucial P2)即将发生磁盘故障的警报。我一直在运行 sudo smartctl -a /dev/nvme
并得到如下输出:
SMART overall-health self-assessment test result: PASSED
SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 3 Celsius
Available Spare: 100%
Available Spare Threshold: 5%
Percentage Used: 1%
Data Units Read: 15,515,158 [7.94 TB]
Data Units Written: 16,500,632 [8.44 TB]
Host Read Commands: 193,875,355
Host Write Commands: 227,509,455
Controller Busy Time: 13,258
Power Cycles: 1,402
Power On Hours: 4,282
Unsafe Shutdowns: 164
Media and Data Integrity Errors: 0
Error Information Log Entries: 2,609
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Error Information (NVMe Log 0x01, 16 of 16 entries)
Num ErrCount SQId CmdId Status PELoc LBA NSID VS
0 2609 0 0x1000 0x4005 0x028 0 0 -
跑步高清哨兵提供独立的结果确认,例如:
Temperature : -3 °C
Highest Temp.: -3 °C
Health : 50 %
Performance : 100 %
The following error(s) detected:
Temperature is above the over-temperature threshold / below the under-temperature threshold.
The health is determined by SSD specific S.M.A.R.T. attribute(s): Available Spare (Percent), Percentage Used
It is recommended to continuously monitor the hard disk status.
因此问题似乎是低温,即使系统运行了一段时间,我主要看到的值也介于 -3 到 3°C 之间。偶尔会达到更合理的水平,如 27°C。当温度为 0°C 或更低时,它会显示严重警告代码。SSD 数据表和共识SuperUser 上最接近的问题0°C 确实是预期的最低工作温度。关于 SSD 无法启动的另一个问题这表明低温可能是磁盘故障的结果而不是原因,但到目前为止我的 SSD 从未出现过故障。
报告的温度低于室外空气温度,更不用说室内温度了,晚上会变冷,但不会那太冷了!我有一个标准的冷却装置:机箱内置的风扇和 APU 附带的 AMD Wraith Spire 冷却器。气流真的有可能将 SSD 温度降低 10-20° 吗?!
如果有的话我应该怎么做?:
- 是的,所有重要数据都已在多个位置频繁备份(谢谢,复制!)。
- 这可能是温度传感器故障吗?有什么方法可以检查或从 SMART 数据中获取更详细的信息吗?
- 我可以尝试退回 SSD(它仍在保修期内),但如果我将其退回,我无论如何都得再买一个,而且还要重新安装所有东西。
- 在网上搜索“SSD 加热”或“SSD 绝缘”只能找到冷却解决方案。有没有什么可以安全地购买或制作来加热 SSD 的东西?
- 还有其他想法吗?
答案1
如果有的话我应该做什么呢?
-3 到 3°C 之间是明显错误的。
使用常识:软件报告的值是错误的。
因此,您应立即采取以下行动:
- 在你不再为此项目感到压力之前什么也不要做
- 找到能够报告准确值的软件(可能存储执行软件来自 Micron)
- 查明报告的温度是否确实值得关注
- 找到确保在存储设备上可靠地存储/检索数据的冷却/加热系统