我的 Ubuntu 盒子开始间歇性地冻结,我想了解如何开始诊断和排除故障?
- 该机器充当服务器,放在我的车库里,通过 Docker 托管少量 Web 应用程序。
- 每隔一段时间,机器就会完全没有响应。它不响应网络请求,我甚至无法通过 SSH 访问它。大约十分钟后,一切又恢复正常。
- 当我通过 SSH 登录到机器时,我可以通过命令看到
top
有东西阻碍了它难的:这正常负荷<0.5但是有时,某物正在推动它超过170!难怪它看上去像被冻住了!
更新:
dmesg -T | grep ill
显示其中一个 Docker 容器最近被系统杀死,昨天也发生了同样的情况。这将与机器再次响应的时间相吻合。
cat /var/log/syslog
没有围绕此标记的条目。
显然,名为 的进程存在问题mattermost
。我必须对此进行进一步调查。
[Do Mär 2 12:18:39 2023] [ 3858] 1000 3858 113617 243 106496 5 0 gsd-rfkill
[Do Mär 2 12:18:39 2023] oom-kill:constraint=CONSTRAINT_NONE,nodemask=(null),cpuset=/,mems_allowed=0,global_oom,task_memcg=/docker/4fef02a344354214b6acb6f36102bc59e9dc50557d5c2632d70ab3daac100a5f,task=bundle,pid=1538755,uid=998
[Do Mär 2 12:18:39 2023] Out of memory: Killed process 1538755 (bundle) total-vm:1578372kB, anon-rss:904568kB, file-rss:0kB, shmem-rss:1956kB, UID:998 pgtables:2900kB oom_score_adj:0
[Do Mär 2 12:19:23 2023] nxnode.bin invoked oom-killer: gfp_mask=0x1100cca(GFP_HIGHUSER_MOVABLE), order=0, oom_score_adj=0
[Do Mär 2 12:19:23 2023] oom_kill_process.cold+0xb/0x10
[Do Mär 2 12:19:23 2023] [ 3858] 1000 3858 113617 243 106496 5 0 gsd-rfkill
[Do Mär 2 12:19:23 2023] oom-kill:constraint=CONSTRAINT_NONE,nodemask=(null),cpuset=/,mems_allowed=0,global_oom,task_memcg=/docker/83ee973eca02114fae81d46c67fd021c6fad40eb124609eff8f6067ff22335dc,task=mattermost,pid=3800325,uid=2000
[Do Mär 2 12:19:23 2023] Out of memory: Killed process 3800325 (mattermost) total-vm:25852356kB, anon-rss:4436936kB, file-rss:0kB, shmem-rss:0kB, UID:2000 pgtables:9268kB oom_score_adj:0
[Fr Mär 3 10:31:08 2023] systemd invoked oom-killer: gfp_mask=0x1100cca(GFP_HIGHUSER_MOVABLE), order=0, oom_score_adj=0
[Fr Mär 3 10:31:08 2023] oom_kill_process.cold+0xb/0x10
[Fr Mär 3 10:31:08 2023] [ 3858] 1000 3858 113617 245 106496 5 0 gsd-rfkill
[Fr Mär 3 10:31:08 2023] oom-kill:constraint=CONSTRAINT_NONE,nodemask=(null),cpuset=/,mems_allowed=0,global_oom,task_memcg=/docker/6ceafe411e36e8c1ceb396ae0fe9e0772399b4d981f0c3b9f108c4b637300d6f,task=bundle,pid=2216864,uid=998
[Fr Mär 3 10:31:08 2023] Out of memory: Killed process 2216864 (bundle) total-vm:1627016kB, anon-rss:922008kB, file-rss:0kB, shmem-rss:1956kB, UID:998 pgtables:2932kB oom_score_adj:0
[Fr Mär 3 10:31:46 2023] nxnode.bin invoked oom-killer: gfp_mask=0x1100cca(GFP_HIGHUSER_MOVABLE), order=0, oom_score_adj=0
[Fr Mär 3 10:31:46 2023] oom_kill_process.cold+0xb/0x10
[Fr Mär 3 10:31:46 2023] [ 3858] 1000 3858 113617 245 106496 5 0 gsd-rfkill
[Fr Mär 3 10:31:46 2023] oom-kill:constraint=CONSTRAINT_NONE,nodemask=(null),cpuset=/,mems_allowed=0,global_oom,task_memcg=/docker/66ecc2904f86807abf8e5a3e5fb9310028a03c19d09f6b8973eb2c6801c943f7,task=mattermost,pid=2425866,uid=2000
[Fr Mär 3 10:31:46 2023] Out of memory: Killed process 2425866 (mattermost) total-vm:101008668kB, anon-rss:4685940kB, file-rss:0kB, shmem-rss:0kB, UID:2000 pgtables:10188kB oom_score_adj:0