如何找出导致滞后/冻结和自重启的原因?

如何找出导致滞后/冻结和自重启的原因?
  • Xubuntu 14.04

  • FF 39.0,由 Canonical 封装

我刚刚经历了我的机器几乎冻结并且没有反应没有任何输入。鼠标指针每 20 秒移动大约 2 毫米,顶部任务栏中的 CPU 负载事物有四分之一是完整的(我想我在这里谈论的是 XFCE 的“CPU 负载”小部件)。当我在这个官方网站上阅读有关 iPhone 安全和加密部分的标签时,发生了这种情况苹果页面(只是说我做了什么,没有别的)。

我尝试通过 TTY1 登录,但它没有接受我输入的任何登录信息。实际上,它接受了我最初输入的内容(比如说john作为用户),所以我在那之后按了 Enter,但什么也没发生。输入用户的密码会在 TTY1 中显示,就像显示任何其他输入一样。CTRL^C如果我按下组合键来中止进程,它还会显示该部分。

在我按下 后,切换回 DE/TTY7 发生了很长时间CTRL + ALT + F7。苹果页面仍然可见。

然后我就看着机器继续做一些事情将近两分钟,然后我看到它重新启动了。 IIRC 关闭消息中包含“开始”、“停止”、“状态”和“等待”一词。

我想我要问的是:我到底需要寻找什么/var/log/syslog?我还需要寻找其他东西吗?

  • 相关时间点的系统日志

  • 说明:我是断开并重新连接以太网线、键盘和鼠标的人。这是一些(蹩脚的)尝试,试图让 Xubuntu 再次识别它们并使用它们。

答案1

免责声明:我对您可能看到的消息的想法似乎与您的报告不太相符,所以我可能遗漏了一些东西。

基本上我想不出很多软件重启故障的原因,你绝对应该考虑硬件。假设如果您提取了某种故障转储,那么解释问题是否实际上是硬件将非常令人沮丧。此时,RAM 测试将是一个好主意(启动memtest86或等效)。 CPU 压力测试也可以很好地检查是否过热。根据您的说法,您可能只需要几分钟运行 4 个cpuburn命令。

根据您的描述,您应该排除的最重要的事情是您的内存不足并且系统正在自我交换而死亡。这不应该导致重新启动。磁盘灯将常亮。通常不会出现 100% cpu 使用率,但某些监视器可能会显示 cpu 处于 100%“IO 等待”状态;这应该是它自己的颜色。

我不希望您看到一条消息:<错误,立即重新启动>。你可能只需在三重故障之前看到来自第一次或第二次故障的一些消息,屏幕就会变黑。这些消息不会写入系统日志 - 您需要设置一个外部内核控制台。 (串行端口,或者网络控制台)。或者尝试这些记录利用 EFI 固件的简要说明(如果您有)。这可能是一个更实用的选择。我不确定如果您尚未安装 pstore 文件系统,它是否会启用。如果您对调试内核感兴趣,这似乎是一件很酷的事情。


某些配置可以从软件启动重新启动。例如,panic=内核启动选项和/或看门狗定时器。 systemd 有一个看门狗功能,可能有几分钟的超时时间。

我相信您的操作系统默认设置不会启用其中任何一个。 (不panic=,也没有 systemd 开始)。如果您尚未启用它们,我们预计只有少数软件故障会导致重新启动。

如果内核在处理内核内部(x86 上)故障的过程中触发故障,机器可能会立即重新启动。又称“三重错”。但其他致命的内核错误会“恐慌”,打印一条消息,并且默认情况下不会重新启动。

否则我们会认为这是一个完全疯狂的错误,它碰巧调用了重新启动代码。也许这不会重复,除非你遇到了很多带有奇怪效果的疯狂错误。

也许我们看到内存损坏(在繁忙期间引起)最终导致三重故障。繁忙期间的内核消息可能会说明这一点。

相关内容