笔记本电脑运行温度比正常情况高约 30°;据报告 CPU/负载正常。什么可能导致这种情况以及如何诊断?

笔记本电脑运行温度比正常情况高约 30°;据报告 CPU/负载正常。什么可能导致这种情况以及如何诊断?

我在 ThinkPad t420 笔记本电脑上运行最新的 Arch Linux,并且遇到了间歇性发热问题,我的温度将从典型的 ~45°C 上升到 ~75-90°C,并一直保持在那里直到我重新启动。

我运行了几种诊断工具,包括htop谷歌搜索建议的显而易见的工具和其他工具,包括powertopiostats,当然还有我不记得的其他工具。到目前为止,我还没有发现任何明显的问题,而且无论我的机器正常运行还是处于这种热状态,读数表面上都没有差异。

我也一一杀死了大部分可疑进程(数据库和其他守护进程),希望能找到隐藏的罪魁祸首,但无济于事。

除了这些尝试之外,我不知道从哪里开始排除故障。我希望有人能给我指出正确的方向,开始寻找更深层次的问题。

准确地说,我的问题不是如何冷却我的机器,而是在(据报道)CPU 和负载正常的系统中,什么会导致持续 30 度以上的热变化?我可以使用哪些工具/实践来诊断它?

一些可能有用的注释:

  • 冷却系统(例如,通过完全脱离风扇控制),但如果不管它,它会立即再次升温。这似乎表明保温不是问题,而是某物不断产生热量。
  • htop进入此热状态后,CPU 使用率和负载会正常报告。这包括内核线程。根据htop,系统基本上处于空闲状态(系统范围 CPU 使用率为 1-2%,负载为 0.10)。
  • 我的机器使用Intel HD集成显卡,并且没有其他显卡。正如 @braiam 所指出的,nVidia 卡是该型号的一个选项;我没有选择它。
  • @terdon 调出了 CPU 调速器设置。我的 CPU 设置为powersave
  • 我的特定处理器是 2.7GHz Core i7-2620M。

编辑:在撰写此问题时,我的风扇控制无法正常运行,并且即使在高温下也持续以中等 RPM 范围(3900 RPM)运行。根据@Alex 和@JustDanyul 的建议,此问题已得到修复。然而,根本问题仍然存在。

答案1

风扇

我的也这样做,运行的是 Fedora 14。尝试使用一罐压缩空气并吹掉机箱背面和侧面的通风口。

此外,您还需要定期卸下键盘并将压缩空气直接吹在风扇叶片上。它们沾满灰尘,并开始通过减轻重量来影响其有效性。

Thinkpad 最好的一点是服务手册!他们向您展示如何拆卸笔记本电脑并将其装回原处。

糟糕的流程

我注意到的另一件事是,我偶尔会遇到一个进程出错并且会 100% 消耗其中一个核心的情况。杀死这个进程通常会使温度恢复正常。

您可以使用htoptop来查看这是什么进程,然后从它们或使用 it's 的终端杀死它PID

还有什么?

请参阅我对此 U&L 问答的回答,了解有关如何获取笔记本电脑各个组件的温度读数的更多提示。问答题为:如何在i3status中获取haswell i7核心的核心温度

答案2

这是一个很长的评论,但你应该看看thinkwiki.org这是ThinkPad 上的 Linux 资源。至于温度,我的t4500也有类似的问题,通过玩来解决

  1. CPU 调速器控制 CPU 频率缩放。您的选择是:

    • 表现使CPU保持在尽可能高的频率
    • 节能使CPU保持在尽可能低的频率
    • 用户空间将可用频率信息导出到用户级别(通过 /sys 文件系统)并允许用户空间控制 CPU 频率
    • 一经请求根据 CPU 使用情况缩放 CPU 频率(与用户空间频率缩放守护进程一样,但在内核中)
    • 保守的行为类似于点播,但频率逐步增加

    一经请求,你的CPU只会在必要时以最高速度运行。理想情况下,这对您来说是完全透明的,您的机器将按照当前任务所需的速度运行。要激活它,请执行以下操作

    sudo echo ondemand > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
    
  2. 风扇控制。有一个非常好的实用程序称为“简单的 ThinkPad 风扇控制“它允许您微调改变风扇速度的触发温度。另请参阅信息这里

答案3

我认为你所认为的“热”是有问题的。对于 Thinkpad t420(根据论坛)约为 80-85 C,让我们忘记 nVidia 卡也可能导致温度升高(实际上 Optimus 配置可能无法正常工作,迫使您的 CPU 执行 GPU 工作)。也就是说,你的CPU最大耐受温度为100C(如果它到达那里,系统将关闭),而气氛大约是10.0°C 至 35.0°C。也就是说,如果您的笔记本电脑在该范围内,则一切正常(除了电池和笔记本电脑的使用寿命)。

现在你想指出可能的嫌疑人。在这方面,我想说的是,nVidia 在 Linux 上的糟糕实现可能会将工作交给你的 CPU,而这些工作不会在 htop(或任何地方)中显示,因为他们臭名昭著的按需系统 Optimus,这似乎适合你当前的困境(它工作正常,直到一会儿,它才开始加热,不受控制)。您应该更新您的安装,直到 Bumblebee 完全配置完毕。您可以bbswitch随意使用 来禁用 nVidia 卡,看看效果如何。

为 Arch 安装 Bumblebee您可以在存储库中找到该包。如果您还没有安装。

答案4

由于手动加速风扇可以解决问题,因此这将是开始故障排除的绝佳位置,因为这似乎表明自动风扇控制不起作用。

现在,你运行 arch linux,这是一个出色的发行版(是的,我也运行它),有一个很棒的 wiki。所以我想问一下,你是RTFM吗? ;p

https://wiki.archlinux.org/index.php/Lenovo_ThinkPad_T420#Fans

据我所知,您需要:

  1. 启用thinkpad_acpi内核模块
  2. 从 AUR 安装并配置 thinkfan 应用程序
  3. 启用thinkfan系统服务

这一切都完成了吗?

更新 我很高兴听到您的风扇现在工作正常,而不仅仅是以快乐的媒介旋转。 (我想这解决了你的机器在80度以上运行的问题?)

在回答 30 度温度变化的根本原因是什么时,我很想问:难道不是因为您的风扇无法正常工作吗?

让我们假设,

  • 处理器没有比平常更努力地工作
  • 温度波动现在被风扇速度波动取代

是否可以安全地假设根本没有问题,问题只是您的风扇运行在勉强应付的水平?环境温度等的微小变化是否会超出其能力极限?

例如,我有一台宏基笔记本电脑,在温暖的日子里,风扇“不断”上下旋转。我敢打赌,如果我的风扇无法实际自我调节,我也会看到相当大的温度波动:)

相关内容