了解崩溃后的日志

了解崩溃后的日志

我的笔记本电脑上有一个新系统(Ubuntu Gnome 16.04),第一周左右它运行得很好,但后来它开始(似乎是随机地)不时地冻结(大约每天一次,有时更多;这是一个完整的系统冻结,到目前为止唯一的选择是强制关机)。我查看了一些系统日志(kern.log、syslog 和 dmesg),在/var/log/syslog最近一次冻结的时间戳中发现了这一点: 系统日志文件的屏幕截图

完整的系统日志在这里,奇怪的线位于 14582 处。

有人能给出一些提示,说明是什么原因导致系统冻结吗?我应该查看其他日志吗?我尝试搜索一些有关如何调试系统崩溃的建议,但找到的信息相当少,也不是很有帮助。例如Ubuntu 维基指南告诉我在 CLI 上复制问题,但我不知道怎么做,因为我不知道是什么崩溃了。我希望在日志中找到一些东西,但建议检查的内容对我这个非专业人士来说没有任何意义。

我想尝试 Ubuntu wiki 中描述的 SysRq 方法,但它与维基百科关于这个主题的文章。这就是我至今犹豫不决是否使用它的原因。如果有人对此有任何建议,我将不胜感激。

这是我的系统信息:

$ uname -a
Linux ultrabook 4.13.0-31-generic #34~16.04.1-Ubuntu SMP Fri Jan 19 17:11:01 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux

更新

今天它又死机了,今天的日志只有错误(由 输出grep -i Error* /var/log/syslog),正如 Elder Geek 所建议的那样,可以找到这里崩溃的时间戳在11:30:24之前,也就是重新启动的时间。

谢谢你的帮助。

答案1

从您过去的案例来看可能很难确认,但我相信这就是原因,如果这对他们有用,其他人将能够投票赞成。

我发现有一定数量的 NVME SSD 磁盘由于电源相关问题无法与 Linux 很好地兼容。

经过数月的故障排除,我发现 Ubuntu 突然无缘无故冻结的原因就是这个。

解决方案是添加以下内核参数:

nvme_core.default_ps_max_latency_us=0

为此,请修改/etc/default/grub并将上述内容添加到您的GRUB_CMDLINE_LINUX_DEFAULT=字符串中,例如我的字符串如下所示:

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash nvme_core.default_ps_max_latency_us=0"

然后保存并运行update-grub

并重新启动系统。

从那以后我的成功率达到了 100%,例如 0 次撞车,甚至偶尔也没有发生一次奇怪的撞车。

@Jena,如果您仍然拥有导致问题的原始 NVME SSD 磁盘,那么最好进行完整的确认。

参考

官方内核错误报告:https://bugzilla.kernel.org/show_bug.cgi?id=195039

相关内容