我的一台服务器的监控参数出现了奇怪的变化。上周日晚上,一台电压测量仪(输入0我认为核心电压) 平均从 ~1V 突然增加 20% 至 ~1.20V。报告的 CPU 核心温度和 CPU 风扇速度相应显著增加,但 CPU 频率 (1.20GHz -> 1.25GHz) 和 CPU 基本负载仅略有增加。
这是什么意思?我怀疑是电源或主板故障。还有其他好的解释吗?目前服务器硬件、BIOS 设置或软件没有变化。
服务器 MB 是 Gigabyte GA-MA69VM-S2,配备 AMD Athlon(tm) 双核处理器 4450e。操作系统是 Ubuntu 12.04.2 LTS,内核为 3.2.0-45-generic。监控由 lm-sensors 1:3.3.1-2ubuntu1 完成。传感器命令的当前输出如下图所示。
k8temp-pci-00c3
Adapter: PCI adapter
Core0 Temp: +38.0°C
Core0 Temp: +35.0°C
Core1 Temp: +35.0°C
Core1 Temp: +37.0°C
it8716-isa-0228
Adapter: ISA adapter
in0: +1.20 V (min = +0.00 V, max = +4.08 V)
in1: +1.89 V (min = +0.00 V, max = +4.08 V)
in2: +3.36 V (min = +0.00 V, max = +4.08 V)
+5V: +2.98 V (min = +0.00 V, max = +4.08 V)
in4: +3.07 V (min = +0.00 V, max = +4.08 V)
in5: +3.23 V (min = +0.00 V, max = +4.08 V)
in6: +0.10 V (min = +0.00 V, max = +4.08 V)
5VSB: +3.02 V (min = +0.00 V, max = +4.08 V)
Vbat: +3.02 V
fan1: 1555 RPM (min = 0 RPM)
fan2: 2860 RPM (min = 0 RPM)
temp1: +29.0°C (low = +127.0°C, high = +127.0°C) sensor = thermistor
temp2: +34.0°C (low = +127.0°C, high = +127.0°C) sensor = thermistor
temp3: +31.0°C (low = +127.0°C, high = +127.0°C) sensor = thermal diode
cpu0_vid: +1.200 V
intrusion0: ALARM
答案1
良好的数据/研究等,而且它确实看起来和你建议的完全一样,某些东西强制将 vcore 提高 .2v - 不知道为什么,但之后的一切都遵循这种模式 - 大概你没有多余的 CPU 可以切换,看看是芯片还是 VRM 的问题,对吗?这就是我真正建议的全部,将问题分开来看问题是否仍然存在。