最近我的系统似乎出现了许多硬件缺陷。最严重的是,我的系统似乎过热(中等负载)并立即关机。我已经发现的一个因素是后风扇没有转动。它似乎只是坏了,因为其针脚上的电压读数(用电压表,而不是传感器)显示 12V。不过,我怀疑风扇不是我唯一的问题。
如何使用 acpi、传感器或其他工具确定硬件损坏的程度?我收到许多错误读数,我不确定它们是对应于硬件故障、不存在的传感器还是只是配置错误的测量软件。
传感器:
sensors
coretemp-isa-0000
Adapter: ISA adapter
ERROR: Can't get value of subfeature temp1_input: Can't read
Core 0: +0.0°C (high = +86.0°C, crit = +100.0°C) ALARM
coretemp-isa-0001
Adapter: ISA adapter
ERROR: Can't get value of subfeature temp1_input: Can't read
Core 1: +0.0°C (high = +86.0°C, crit = +100.0°C) ALARM
f71882fg-isa-0a00
Adapter: ISA adapter
+3.3V: +3.36 V
in1: +1.22 V (max = +2.04 V)
in2: +1.02 V
in3: +0.86 V
in4: +0.96 V
in5: +1.10 V
in6: +0.90 V
3VSB: +3.36 V
Vbat: +3.04 V
fan1: 868 RPM
fan2: 0 RPM ALARM
fan3: 0 RPM ALARM
fan4: 0 RPM ALARM
temp1: +89.0°C (high = +85.0°C, hyst = +81.0°C) ALARM
(crit = +100.0°C, hyst = +96.0°C) sensor = transistor
temp2: +33.0°C (high = +85.0°C, hyst = +81.0°C)
(crit = +100.0°C, hyst = +96.0°C) sensor = transistor
temp3: FAULT (high = +70.0°C, hyst = +68.0°C)
(crit = +85.0°C, hyst = +83.0°C) sensor = transistor
并且毫无帮助:
acpi -V
No support for device type: power_supply
No support for device type: power_supply
Cooling 0: Processor 0 of 0
Cooling 1: Processor 0 of 7
使用 KDE plasma 小部件,我可以看到它temp1
在 89-92 之间波动,而temp2
读数为恒定的 33(即它坏了)。我从来没有真正注意到这一点,直到我的电脑在中等负载下开始变得异常缓慢并立即死机。然后我看到上面dmesg
到处都是
[ 1561.568839] CPU1: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 1561.568857] CPU0: Core temperature above threshold, cpu clock throttled (total events = 1)
[ 1800.040047] Machine check events logged
我没有太多解读温度读数或嗅探坏硬件的经验——整个现象真的可以用死机风扇来解释吗?我拆下了一个机箱面板(它似乎可以提供与小型 4 英寸风扇一样多的额外通风量),CPU、PSU 和机箱前部风扇都在全负荷运行,但似乎没有任何区别。我仍然得到非常高的温度读数和频繁关机。我该怎么办?
答案1
这不是一个 ubuntu 问题,但是,我尽力帮助您:
打开电脑外壳通常会使情况变得更糟,但是,你可以使用一个大的通风机,并将其放在打开的一侧
脏的冷却器通常是个问题 - 清除所有灰尘
最好的办法,但你需要一些经验:拆下 CPU 冷却器,清洁所有东西,然后重新安装,涂上少量(不要太多)导热膏。确保冷却器固定在 CPU 上(甚至夹子可能随着时间的推移而自行松开)。