症状是 CPU 使用率高时温度高,超过 100°C 时会重新启动(信息摘自 ACPITZ/1 条目)。我发现启动板中有关错误风扇速度的条目但即使我强制将风扇调到最大(参见启动板条目的错误描述),计算机在 CPU 使用率高一分钟后仍会重新启动。
但我开始怀疑我的情况有几个错误。我的电池寿命为 2 到 3 小时,是我使用 ubuntu 11.10 之前的一半(约 5 小时)。所以它可能与 ASPM 错误有关,但即使最近更新了内核,我仍然遇到问题。我试过了发现多个内核启动开关修复程序使用 ubuntu 11.10 但实际上没有什么变化。关于 ASPM,dmesg 返回:
$ dmesg | grep ASPM
[ 0.160288] ACPI FADT declares the system doesn't support PCIe ASPM, so disable it
也许我需要用 12.04 再试一次?
最后两件事: - 我无法打开我的电脑清除可能的灰尘(电脑归我公司所有,保修等等......) - 我看到某处可能存在 GPU 过热的情况(找不到链接),有人有这样的经历吗?
欢迎任何提示、线索或建议...
更新 1
我还运行了“powertop”并看到了其他一些东西:
首先,处理器的 Turbo 模式始终有 25% 的时间在运行:
Package | CPU 0
Turbo Mode 24.4% | Turbo Mode 21.7%
2.81 Ghz 1.8% | 2.81 Ghz 1.6%
2.14 Ghz 0.9% | 2.14 Ghz 0.9%
1.60 Ghz 3.3% | 1.60 Ghz 3.3%
800 Mhz 57.5% | 800 Mhz 55.2%
Idle 12.1% | Idle 17.4%
| CPU 1
| Turbo Mode 24.1%
| 2.81 Ghz 1.8%
| 2.14 Ghz 0.9%
| 1.60 Ghz 3.2%
| 800 Mhz 54.5%
| Idle 15.5%
其次,“可调参数”选项卡打印了许多具有重要运行时间的设备(没有经济能源模式?):
Bad Enable SATA link power management for /dev/sda
Bad NMI watchdog should be turned off
Bad Power Aware CPU scheduler
Bad VM writeback timeout
Bad Enable Audio codec power management
Bad Autosuspend for USB device Fingerprint Sensor [4-1]
Bad Autosuspend for USB device USB Receiver (Logitech)
Bad Autosuspend for USB device Android Phone (HTC)
Bad Runtime PM for PCI Device Intel Corporation Mobile 4 Series Chipset Memory Controller Hub
Bad Runtime PM for PCI Device Ricoh Co Ltd R5C832 IEEE 1394 Controller
Bad Runtime PM for PCI Device Intel Corporation Mobile 4 Series Chipset MEI Controller
Bad Runtime PM for PCI Device Intel Corporation 82567LF Gigabit Network Connection
Bad Runtime PM for PCI Device Intel Corporation 82801I (ICH9 Family) USB UHCI Controller #4
Bad Runtime PM for PCI Device Intel Corporation 82801I (ICH9 Family) USB2 EHCI Controller #2
Bad Runtime PM for PCI Device Intel Corporation 82801I (ICH9 Family) HD Audio Controller
Bad Runtime PM for PCI Device Ricoh Co Ltd xD-Picture Card Controller
Bad Runtime PM for PCI Device Ricoh Co Ltd R5C592 Memory Stick Bus Host Adapter
Bad Runtime PM for PCI Device Ricoh Co Ltd R5C822 SD/SDIO/MMC/MS/MSPro Host Adapter
Bad Runtime PM for PCI Device Intel Corporation Mobile 4 Series Chipset Integrated Graphics Controller
Bad Runtime PM for PCI Device Intel Corporation Ultimate N WiFi Link 5300
Bad Runtime PM for PCI Device Ricoh Co Ltd RL5c476 II
Bad Runtime PM for PCI Device Intel Corporation 82801I (ICH9 Family) USB UHCI Controller #6
Bad Runtime PM for PCI Device Intel Corporation 82801I (ICH9 Family) PCI Express Port 4
Bad Runtime PM for PCI Device Intel Corporation 82801I (ICH9 Family) PCI Express Port 5
Bad Runtime PM for PCI Device Intel Corporation 82801I (ICH9 Family) USB UHCI Controller #1
Bad Runtime PM for PCI Device Intel Corporation 82801I (ICH9 Family) USB UHCI Controller #2
Bad Runtime PM for PCI Device Intel Corporation 82801I (ICH9 Family) PCI Express Port 2
Bad Runtime PM for PCI Device Intel Corporation 82801I (ICH9 Family) PCI Express Port 3
Bad Runtime PM for PCI Device Intel Corporation 82801I (ICH9 Family) USB2 EHCI Controller #1
Bad Runtime PM for PCI Device Intel Corporation 82801I (ICH9 Family) USB UHCI Controller #3
Bad Runtime PM for PCI Device Intel Corporation 82801IBM/IEM (ICH9M/ICH9M-E) 4 port SATA Controller [AHCI mode]
Bad Runtime PM for PCI Device Intel Corporation 82801I (ICH9 Family) USB UHCI Controller #5
Bad Runtime PM for PCI Device Intel Corporation 82801I (ICH9 Family) PCI Express Port 1
第三,关于“Power Aware CPU scheduler”,将 cpu 策略更改为 powersave 并不能解决问题。
更新 2
使用开关“acpi_osi=Linux”(如这里所述) 并不能解决问题。
更新 3
似乎这不是 ASPM 的问题,因为我的电脑似乎不支持它。如果我必须pcie_aspm=force
使用内核,我会得到以下输出:
$ dmesg | grep ASPM
[ 0.000000] PCIe ASPM is forcibly enabled
[ 0.197865] ACPI FADT declares the system doesn't support PCIe ASPM, so disable it
答案1
最近在 T400 上遇到了同样的问题。我的问题原来与 OS 可切换图形适配器有关。试试这个:
~$lspci | grep VGA
如果返回包含多个图形适配器,那么您需要在 BIOS 中禁用集成图形适配器。
在我的 t400 BIOS 设置中它应该是:
--->配置----->显示----->
--默认显示设备 = PCI Express
--启动显示设备 = Thinkpad LCD
--图形设备 = Discreet Graphics
--可切换显卡的操作系统检测 = 已禁用
如果您的 t500 确实具有可切换图形适配器(其中包括独立的 AMD/ATI 适配器),那么您还需要安装 fglrx 驱动程序。
答案2
我的联想 T500 也存在过热问题。当我使用 10.04 LTS 时,温度在 60C 左右,即使在观看高清电影等时也是如此……现在使用 12.04 LTS 时,温度在 70C 左右。开始使用电脑时,温度很容易超过 80C。我确实安装了 thinkfan 并对其进行了配置:etc/thinkfan.conf
(0,0,55)(1,54,57)(2,56,60)(3,57,63)(4,58,65)(5,60,66)(7,70,80)(127,75,32767)
12.04 LTS 真的更重吗?占用那么多 CPU。还是我漏掉了什么?:)
附言:显示温度和实际温度相同可能是个 bug?或者这只是我的小小愿望 :)。
答案3
我有一台 W500,刚刚装上 12.04。我确实启用了 ATI 卡。我相当确定风扇不会调到最快速度 (7)。我无法获得手动选项或 thinkfan 之类的东西来驱动它。我喜欢 tpfan-admin,但 python 中的一些东西发生了变化这个错误。
与此同时,我可以强制使用:
echo level 7 | sudo tee /proc/acpi/ibm/fan
(发现于http://www.thinkwiki.org/wiki/How_to_control_fan_speed。
我发誓昨天我什么也没得到/proc/acpi/ibm
。
今天重启后有什么变化吗?!
答案4
那内核 3.4 呢?有什么消息吗?它真的能解决问题吗?由于我的联想 T500 真的过热了(就像做梦一样,但我看到我的笔记本电脑闪闪发光),我不想尝试烧毁我的笔记本电脑。所以如果有人能告诉我 12.04 和过热问题是怎么回事,我会非常高兴。谢谢!
ps 正如我所说... 内核 3.4 应该可以解决这个问题。Indicator-cpufreq 并没有真正起到作用。过了一会儿,它又跳回到“按需”模式,并且变得过热。我的笔记本电脑进行了深度清洁。所以这不是“灰尘问题”。:(