OOM 杀手如何决定首先杀死哪个进程?

OOM 杀手如何决定首先杀死哪个进程?

答案根据 的值解释了当遇到 OOM 情况时内核采取的操作sysctl vm.overcommit_memory

overcommit_memory设置为 0 或 1 时,overcommit启用,并且允许程序分配比实际可用的内存更多的内存。

现在,当我们在这种情况下内存不足时会发生什么?如何OOM 杀手决定先杀死哪个进程?

答案1

如果内存被进程耗尽,达到可能威胁系统稳定性的程度,那么 OOM 杀手就会出现。

笔记:OOM Killer 的任务是继续终止进程,直到释放足够的内存以使内核尝试运行的进程的其余部分顺利运行。

OOM Killer 必须选择最好的要杀死的进程。最好的这里指的是杀死后会释放最大内存的进程,也是对系统最不重要的进程。

主要目标是杀死最少数量的进程,从而最大限度地减少造成的损害,同时最大限度地释放内存量。

为了促进这一点,内核oom_score为每个进程维护一个。您可以在该目录下的文件系统oom_score中看到每个进程的信息。/procpid

$ cat /proc/10292/oom_score

任何进程的价值越高oom_score,被杀死的可能性就越大内存溢出杀手在内存不足的情况下。

是如何OOM_Score计算的?

在 David 的补丁集中,旧的 badness() 启发法几乎完全消失了。相反,计算变成了一个简单的问题:进程正在使用多少百分比的可用内存。如果系统整体内存不足,那么“可用内存”就是系统可用的所有 RAM 和交换空间的总和。

相反,如果 OOM 情况是由于耗尽给定 cpuset/控制组允许的内存而引起的,则“可用内存”是分配给该控制组的总量。如果超出内存策略施加的限制,则会进行类似的计算。在每种情况下,进程的内存使用量都被视为其驻留集(正在使用的 RAM 页数)与其交换使用量的总和。

该计算产生一个百分比乘以十的数字;使用可用内存的每个字节的进程将获得 1000 分,而根本不使用内存的进程将获得零分。对这个分数的启发式调整很少,但代码仍然从 root 拥有的进程的分数中减去少量 (30),因为它们比用户拥有的进程稍微更有价值。

另一项应用的调整是添加存储在每个进程的 oom_score_adj 变量中的值,该变量可以通过 /proc 进行调整。该旋钮允许调整每个进程对用户空间中 OOM 杀手的吸引力;将其设置为 -1000 将完全禁用 OOM 终止,而设置为 +1000 相当于在关联进程上绘制一个大目标。

参考

http://www.queryhome.com/15491/whats-happening-kernel-starting-killer-choose-which-process https://serverfault.com/a/571326

相关内容