我在 ThinkPad t420 笔记本电脑上运行最新的 Arch Linux,并且遇到了间歇性发热问题,我的温度将从典型的 ~45°C 上升到 ~75-90°C,并一直保持在那里直到我重新启动。
我运行了几种诊断工具,包括htop
谷歌搜索建议的显而易见的工具和其他工具,包括powertop
、iostats
,当然还有我不记得的其他工具。到目前为止,我还没有发现任何明显的问题,而且无论我的机器正常运行还是处于这种热状态,读数表面上都没有差异。
我也一一杀死了大部分可疑进程(数据库和其他守护进程),希望能找到隐藏的罪魁祸首,但无济于事。
除了这些尝试之外,我不知道从哪里开始排除故障。我希望有人能给我指出正确的方向,开始寻找更深层次的问题。
准确地说,我的问题不是如何冷却我的机器,而是在(据报道)CPU 和负载正常的系统中,什么会导致持续 30 度以上的热变化?我可以使用哪些工具/实践来诊断它?
一些可能有用的注释:
- 我能冷却系统(例如,通过完全脱离风扇控制),但如果不管它,它会立即再次升温。这似乎表明保温不是问题,而是某物不断产生热量。
htop
进入此热状态后,CPU 使用率和负载会正常报告。这包括内核线程。根据htop
,系统基本上处于空闲状态(系统范围 CPU 使用率为 1-2%,负载为 0.10)。- 我的机器使用Intel HD集成显卡,并且没有其他显卡。正如 @braiam 所指出的,nVidia 卡是该型号的一个选项;我没有选择它。
- @terdon 调出了 CPU 调速器设置。我的 CPU 设置为
powersave
- 我的特定处理器是 2.7GHz Core i7-2620M。
编辑:在撰写此问题时,我的风扇控制无法正常运行,并且即使在高温下也持续以中等 RPM 范围(3900 RPM)运行。根据@Alex 和@JustDanyul 的建议,此问题已得到修复。然而,根本问题仍然存在。
答案1
风扇
我的也这样做,运行的是 Fedora 14。尝试使用一罐压缩空气并吹掉机箱背面和侧面的通风口。
此外,您还需要定期卸下键盘并将压缩空气直接吹在风扇叶片上。它们沾满灰尘,并开始通过减轻重量来影响其有效性。
Thinkpad 最好的一点是服务手册!他们向您展示如何拆卸笔记本电脑并将其装回原处。
糟糕的流程
我注意到的另一件事是,我偶尔会遇到一个进程出错并且会 100% 消耗其中一个核心的情况。杀死这个进程通常会使温度恢复正常。
您可以使用htop
或top
来查看这是什么进程,然后从它们或使用 it's 的终端杀死它PID
。
还有什么?
请参阅我对此 U&L 问答的回答,了解有关如何获取笔记本电脑各个组件的温度读数的更多提示。问答题为:如何在i3status中获取haswell i7核心的核心温度。
答案2
这是一个很长的评论,但你应该看看thinkwiki.org这是这ThinkPad 上的 Linux 资源。至于温度,我的t4500也有类似的问题,通过玩来解决
CPU 调速器控制 CPU 频率缩放。您的选择是:
- 表现使CPU保持在尽可能高的频率
- 节能使CPU保持在尽可能低的频率
- 用户空间将可用频率信息导出到用户级别(通过 /sys 文件系统)并允许用户空间控制 CPU 频率
- 一经请求根据 CPU 使用情况缩放 CPU 频率(与用户空间频率缩放守护进程一样,但在内核中)
- 保守的行为类似于点播,但频率逐步增加
和一经请求,你的CPU只会在必要时以最高速度运行。理想情况下,这对您来说是完全透明的,您的机器将按照当前任务所需的速度运行。要激活它,请执行以下操作
sudo echo ondemand > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
风扇控制。有一个非常好的实用程序称为“简单的 ThinkPad 风扇控制“它允许您微调改变风扇速度的触发温度。另请参阅信息这里。
答案3
我认为你所认为的“热”是有问题的。对于 Thinkpad t420(根据论坛)约为 80-85 C,让我们忘记 nVidia 卡也可能导致温度升高(实际上 Optimus 配置可能无法正常工作,迫使您的 CPU 执行 GPU 工作)。也就是说,你的CPU最大耐受温度为100C(如果它到达那里,系统将关闭),而气氛大约是10.0°C 至 35.0°C。也就是说,如果您的笔记本电脑在该范围内,则一切正常(除了电池和笔记本电脑的使用寿命)。
现在你想指出可能的嫌疑人。在这方面,我想说的是,nVidia 在 Linux 上的糟糕实现可能会将工作交给你的 CPU,而这些工作不会在 htop(或任何地方)中显示,因为他们臭名昭著的按需系统 Optimus,这似乎适合你当前的困境(它工作正常,直到一会儿,它才开始加热,不受控制)。您应该更新您的安装,直到 Bumblebee 完全配置完毕。您可以bbswitch
随意使用 来禁用 nVidia 卡,看看效果如何。
为 Arch 安装 Bumblebee您可以在存储库中找到该包。如果您还没有安装。
答案4
由于手动加速风扇可以解决问题,因此这将是开始故障排除的绝佳位置,因为这似乎表明自动风扇控制不起作用。
现在,你运行 arch linux,这是一个出色的发行版(是的,我也运行它),有一个很棒的 wiki。所以我想问一下,你是RTFM吗? ;p
https://wiki.archlinux.org/index.php/Lenovo_ThinkPad_T420#Fans
据我所知,您需要:
- 启用thinkpad_acpi内核模块
- 从 AUR 安装并配置 thinkfan 应用程序
- 启用thinkfan系统服务
这一切都完成了吗?
更新 我很高兴听到您的风扇现在工作正常,而不仅仅是以快乐的媒介旋转。 (我想这解决了你的机器在80度以上运行的问题?)
在回答 30 度温度变化的根本原因是什么时,我很想问:难道不是因为您的风扇无法正常工作吗?
让我们假设,
- 处理器没有比平常更努力地工作
- 温度波动现在被风扇速度波动取代
是否可以安全地假设根本没有问题,问题只是您的风扇运行在勉强应付的水平?环境温度等的微小变化是否会超出其能力极限?
例如,我有一台宏基笔记本电脑,在温暖的日子里,风扇“不断”上下旋转。我敢打赌,如果我的风扇无法实际自我调节,我也会看到相当大的温度波动:)