根据传感器信息解读硬件损坏情况

根据传感器信息解读硬件损坏情况

最近我的系统似乎出现了许多硬件缺陷。最严重的是,我的系统似乎过热(中等负载)并立即关机。我已经发现的一个因素是后风扇没有转动。它似乎只是坏了,因为其针脚上的电压读数(用电压表,而不是传感器)显示 12V。不过,我怀疑风扇不是我唯一的问题。
如何使用 acpi、传感器或其他工具确定硬件损坏的程度?我收到许多错误读数,我不确定它们是对应于硬件故障、不存在的传感器还是只是配置错误的测量软件。

传感器:

sensors
coretemp-isa-0000
Adapter: ISA adapter
ERROR: Can't get value of subfeature temp1_input: Can't read
Core 0:       +0.0°C  (high = +86.0°C, crit = +100.0°C)  ALARM  

coretemp-isa-0001
Adapter: ISA adapter
ERROR: Can't get value of subfeature temp1_input: Can't read
Core 1:       +0.0°C  (high = +86.0°C, crit = +100.0°C)  ALARM  

f71882fg-isa-0a00
Adapter: ISA adapter
+3.3V:       +3.36 V
in1:         +1.22 V  (max =  +2.04 V)   
in2:         +1.02 V
in3:         +0.86 V
in4:         +0.96 V
in5:         +1.10 V
in6:         +0.90 V
3VSB:        +3.36 V
Vbat:        +3.04 V
fan1:        868 RPM
fan2:          0 RPM  ALARM
fan3:          0 RPM  ALARM
fan4:          0 RPM  ALARM
temp1:       +89.0°C  (high = +85.0°C, hyst = +81.0°C)  ALARM  
                      (crit = +100.0°C, hyst = +96.0°C)  sensor = transistor
temp2:       +33.0°C  (high = +85.0°C, hyst = +81.0°C)  
                      (crit = +100.0°C, hyst = +96.0°C)  sensor = transistor
temp3:         FAULT  (high = +70.0°C, hyst = +68.0°C)  
                      (crit = +85.0°C, hyst = +83.0°C)  sensor = transistor

并且毫无帮助:

acpi -V
No support for device type: power_supply
No support for device type: power_supply
Cooling 0: Processor 0 of 0
Cooling 1: Processor 0 of 7

使用 KDE plasma 小部件,我可以看到它temp1在 89-92 之间波动,而temp2读数为恒定的 33(即它坏了)。我从来没有真正注意到这一点,直到我的电脑在中等负载下开始变得异常缓慢并立即死机。然后我看到上面dmesg到处都是

[ 1561.568839] CPU1: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 1561.568857] CPU0: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 1800.040047] Machine check events logged

我没有太多解读温度读数或嗅探坏硬件的经验——整个现象真的可以用死机风扇来解释吗?我拆下了一个机箱面板(它似乎可以提供与小型 4 英寸风扇一样多的额外通风量),CPU、PSU 和机箱前部风扇都在全负荷运行,但似乎没有任何区别。我仍然得到非常高的温度读数和频繁关机。我该怎么办?

答案1

这不是一个 ubuntu 问题,但是,我尽力帮助您:

  • 打开电脑外壳通常会使情况变得更糟,但是,你可以使用一个大的通风机,并将其放在打开的一侧

  • 脏的冷却器通常是个问题 - 清除所有灰尘

  • 最好的办法,但你需要一些经验:拆下 CPU 冷却器,清洁所有东西,然后重新安装,涂上少量(不要太多)导热膏。确保冷却器固定在 CPU 上(甚至夹子可能随着时间的推移而自行松开)。

相关内容