每当我使用超过少量 RAM 时,我的 ubuntu 20.04.2 机器就会不断崩溃。例如,如果我在 chrome 中打开 Jupyter 笔记本并进行一些 CPU 密集型计算,整个系统通常会完全冻结,所以我甚至无法移动鼠标。我可以使用 Alt-sysrq-f“修复它”,但这真的不理想。
似乎可能是 OOM killer 导致了这个问题。16GB Linux 机器的标准设置(swapiness 等)是什么,这样我就可以复制它们并查看是否能解决问题?这现在让我抓狂了。
free -h
total used free shared buff/cache available
Mem: 13Gi 3.0Gi 7.9Gi 119Mi 2.8Gi 10Gi
Swap: 2.0Gi 0B 2.0Gi
sysctl vm.swappiness
vm.swappiness = 10
grep -i swap /etc/fstab
/swapfile none swap sw 0 0
ls -la /usr/share/gnome-shell/extensions/
total 20
drwxr-xr-x 5 root root 4096 Apr 23 2020 .
drwxr-xr-x 7 root root 4096 Mar 26 09:01 ..
drwxr-xr-x 2 root root 4096 Aug 14 2020 desktop-icons@csoriano
drwxr-xr-x 3 root root 4096 Dec 17 09:28 [email protected]
drwxr-xr-x 3 root root 4096 Nov 24 12:06 [email protected]
ls -la /var/crash
total 66968
drwxrwsrwt 2 root whoopsie 4096 Mar 31 18:51 .
drwxr-xr-x 14 root root 4096 Apr 23 2020 ..
-rw-r----- 1 user whoopsie 68556347 Mar 31 18:51 _usr_share_teams_teams.1000.crash
-rw-r--r-- 1 user whoopsie 0 Mar 31 18:51 _usr_share_teams_teams.1000.upload
-rw------- 1 whoopsie whoopsie 37 Mar 31 18:51 _usr_share_teams_teams.1000.uploaded
输出top
top - 16:55:35 up 1 min, 1 user, load average: 2.35, 0.79, 0.28
Tasks: 364 total, 3 running, 361 sleeping, 0 stopped, 0 zombie
%Cpu(s): 5.4 us, 1.1 sy, 0.0 ni, 90.9 id, 2.1 wa, 0.0 hi, 0.5 si, 0.0 st
MiB Mem : 13939.7 total, 9030.9 free, 2293.8 used, 2615.0 buff/cache
MiB Swap: 4096.0 total, 4096.0 free, 0.0 used. 11294.8 avail Mem
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
4035 user 20 0 6268860 205524 110728 S 24.2 1.4 0:05.56 skypefo+
3579 user 20 0 826360 233764 152592 S 5.3 1.6 0:04.88 chrome
1630 user 20 0 5359780 307316 118844 S 4.3 2.2 0:08.09 gnome-s+
4116 user 20 0 5626104 113272 91952 S 4.3 0.8 0:00.56 skypefo+
3618 user 20 0 649480 137168 91180 S 4.0 1.0 0:02.42 chrome
1299 user 20 0 1433488 90628 56156 S 2.6 0.6 0:02.52 Xorg
3834 user 20 0 36.4g 142796 88768 S 2.3 1.0 0:04.01 chrome
3877 user 20 0 2200908 115344 79896 S 2.3 0.8 0:07.09 skypefo+
2258 user 20 0 2747244 134668 94496 S 1.3 0.9 0:01.39 teams
2401 user 20 0 2741456 414736 115904 S 1.3 2.9 0:18.69 teams
4045 user 20 0 816792 53108 40540 R 0.7 0.4 0:00.55 gnome-t+
65 root 20 0 0 0 0 I 0.3 0.0 0:00.16 kworker+
240 root 20 0 0 0 0 I 0.3 0.0 0:00.23 kworker+
241 root 20 0 0 0 0 I 0.3 0.0 0:00.13 kworker+
663 root -2 0 0 0 0 S 0.3 0.0 0:00.55 gfx
1106 root 20 0 335928 19916 16752 S 0.3 0.1 0:01.09 Network+
4087 user 20 0 12160 4032 3268 R 0.3 0.0 0:00.04 top
sudo lshw -C memory
给出https://paste.ubuntu.com/p/4jS9HFBqN3/
答案1
交换
您的 /swapfile 可能太小。让我们将其从 2G 更改为 4G,看看是否有帮助...
笔记:命令使用不当dd
可能导致数据丢失。建议复制/粘贴。
在里面terminal
...
sudo swapoff -a # turn off swap
sudo rm -i /swapfile # remove old /swapfile
sudo dd if=/dev/zero of=/swapfile bs=1M count=4096
sudo chmod 600 /swapfile # set proper file protections
sudo mkswap /swapfile # init /swapfile
sudo swapon /swapfile # turn on swap
free -h # confirm 16G RAM and 4G swap
sudo -H gedit /etc/fstab
使用或编辑 /etc/fstab sudo pico /etc/fstab
。
确认 /etc/fstab 中的此 /swapfile 行...并确认没有其他“交换”行...在此行中使用空格...确认没有制表符...
/swapfile none swap sw 0 0
reboot # reboot and verify operation
记忆测试
去https://www.memtest86.com/并免费下载/运行它们memtest
来测试你的记忆力。至少完成一次所有 4/4 测试以确认记忆力良好。这可能需要几个小时才能完成。
笔记:vm.swappiness=10 可能太低(60 是默认值),13G RAM 是一个奇怪的数字。让我们回顾一下sudo lshw -C memory
。我们稍后可能会修改 vm.swappiness。
更新#1:
记忆
您的内存可能安装不正确,并且/或者您的 DIMM 可能有缺陷,因为您有两个 8G DIMMS,但只显示 13G RAM,并且两个 DIMMS 都显示在 DIMM1 内存插槽中。
笔记:AMD Ryzen 处理器因 RAM 兼容性问题而臭名昭著。
查阅您的 PC/主板的用户手册,确认您已将内存安装到正确的插槽中以实现内存交叉。如果可能,请重新安装 DIMM。
更新 #2:
BIOS
技嘉A320M-S2H
修订版 1https://www.gigabyte.com/us/Motherboard/GA-A320M-S2H-rev-1x#kf
修订版 2https://www.gigabyte.com/us/Motherboard/GA-A320M-S2H-rev-20#kf
修订版 3https://www.gigabyte.com/us/Motherboard/GA-A320M-S2H-rev-3x#kf
您的 BIOS 版本为:F51c,发布日期:2020 年 7 月 2 日。根据您使用的主板版本,有更新的 BIOS 可用。请参阅上面的链接。