Ubuntu 突然崩溃并黑屏,可能是过热

Ubuntu 突然崩溃并黑屏,可能是过热

我最近在台式电脑上安装了 Ubuntu 13.10 64 位(与 Win 7 双启动),但每隔一段时间屏幕就会突然关闭,风扇速度变慢,并且系统似乎崩溃。我看不到实际发生的情况,因为屏幕关闭(没有输入),但声音也崩溃了。我所能做的就是按下计算机本身的重置按钮,然后它就会启动,没有任何问题或提及问题。

起初,这种情况是在正常使用中随机意外发生的,只需在全新安装后打开 Firefox 或在桌面上移动光标即可。现在,似乎只有当我执行 CPU 密集型操作(例如观看视频或导入音乐库)时才会发生这种情况。我不确定发生了什么变化,因为我所做的只是将其关闭一天然后再回来。

此后我清理了计算机内部的灰尘,所有风扇似乎都在旋转。

系统规格为:

AMD 羿龙 II X4 965 3.4 GHz

ATI Radeon HD 4870,Ubuntu 表示 AMD RV770 上的驱动程序是 Gallium 0.4

答案1

我在上面发布了非常相似的内容询问 Ubuntu很久以前,当我刚购买的一台笔记本电脑出现与您类似的症状时,由于过热1。

出现症状时,系统是否已关闭? (只是屏幕关闭,还是整个系统关闭?)

症状

根据我的经验,我所拥有的过热机器中:

  • Windows 将直接关闭。没有蓝屏,没有警告,只是“哦,我的机器关机了。”它不会记录其原因,但确实会发出“嗯,我似乎没有正确关闭”。
  • Linux 将执行优雅但强制的关闭。磁盘将正常卸载,但应用程序可能会被强制关闭。 (未保存的数据可能会丢失。)如果热量是问题所在,根据我的经验,Linux 会记录此问题。 (不过,这可能取决于确切的设置和发行版。)

确定热量是否是您的问题

“过热”可能是一个难以隔离的问题。

  1. 在日志中找到它。检查文件/var/log,特别是dmesg日志、内核日志等。在/var/log/messages我有:

    [ 9855.198401] thinkpad_acpi: temperatures (Celsius): 85 43 35 62 27 N/A 28 N/A 35 44 60 N/A N/A N/A N/A N/A
    

    后来我发现了另一条更明确的消息,大意是“嘿,达到温度跳变点,有些事情变得很关键”。不幸的是,我没有在 Ask Ubuntu 上记录我在哪里找到这个的。

  2. 观察机器的温度。您可以通过重复运行在终端中执行此操作sensors,这将显示类似以下内容的内容:

    temp2:        +96.0°C  (crit = +100.0°C)
    

    在这里,我的第二个温度传感器为 96°C。 (请注意,这里的温度单位是​​摄氏度:在这个例子中,它来自我(短暂)拥有的一台笔记本电脑,我距离能够用这个 CPU 烧水还有几度。这不是一件好事。)该crit = +100.0°C位指示“跳变点”,即操作系统将关注硬件状态的点。 (然后关机。)我至少碰到了其中一个。

距离跳变点 4°C 太热了。 96°C 太热了。作为比较,当所有 CPU 都处于 100% 运行时,我当前的台式机运行温度为 66°C — 由于我自己安装了散热器/风扇,专业构建的系统可能运行温度更低。闲置时,温度约为 33–36°C。

请注意,虽然 96°C 的温度足以烧伤你,但我的笔记本电脑是可以触摸的,而且只是“非常热”。当你到达箱子时,热量已经足够消散了。

强制问题重现

警告:接下来是什么将要导致 CPU 发热,如果 CPU 没有得到适当冷却,则存在损坏 CPU 的风险。使用风险自负。 (我思考一些现代CPU可能有内部防热故障保护装置,但我很确定您在这里会使保修失效。)您可以非常简单地“引发”过热:启动多个无限循环来加热 CPU。python -c "while True: pass"会这样做。 (Ctrl+C 来杀死它。)(你可能需要生成多个进程,每个 CPU 一个。逐渐进行,并用 观察热量输出sensors)(另外,我发现 Minecraft 在这方面也很擅长.)

就我而言,我用它来尝试复制症状,并进一步确定确实是热量导致了问题。

1 幸运的是,我在购买笔记本电脑时享受 30 天无理由退货服务。该零售商的“技术人员”“相信”机器不会过热。 (我确信他们错了。)

相关内容