当系统 RAM 不足时，IO 速率较高

2024-6-7 • tag-icon

当系统 RAM 不足时，IO 速率较高

我发现当系统内存不足时，磁盘IO使用率会很高。

看来很多流程都是阅读疯狂地从硬盘（检查htop下面的输出）。当我杀死一个使用过多内存的进程时，为系统释放一些内存。 IO使用率下降至正常状态。

可以通过编写一个消耗大量内存的程序来重现该问题，直到机器上没有足够的内存为止。当您杀死正在运行的程序时，一切都会恢复正常。

我知道操作系统的交换机制。但似乎整个过程中都没有使用交换（检查free并vmstat输出如下）。

❯ free -h
              total        used        free      shared  buff/cache   available
Mem:          859Mi       692Mi        60Mi        25Mi       106Mi        36Mi
Swap:            0B          0B          0B

❯ htop
PID   RES   SHR CPU% MEM%   TIME+    DISK READ  DISK WRITE    DISK R/W Command
 6386 37316  5380  0.7  4.2 10:40.07   14.96 M/s    0.00 B/s   14.96 M/s ahdbserver-1.3.2-SNAPSH
23252 17880 15748  0.0  2.0  0:01.24    7.91 M/s    0.00 B/s    7.91 M/s postgres -D /var/lib/po
29428   400     0  0.0  0.0  0:02.63    3.36 M/s    2.63 K/s    3.36 M/s sgagent -d
 2369  197M     0  0.0 23.0  0:01.00    1.86 M/s    0.00 B/s    1.86 M/s java -jar memtest-1.0-S
24596 10820     0  0.0  1.2  0:59.53  694.74 K/s    0.00 B/s  694.74 K/s frps -c frps.ini
22901  122M     0  2.0 14.2  1:15.23  644.74 K/s    0.00 B/s  644.74 K/s srcds_linux -game dod -
 8735  2016    52  0.7  0.2  1:46.21  344.74 K/s    0.00 B/s  344.74 K/s htop
 2959  4664   176  0.0  0.5 15:35.06  318.42 K/s    0.00 B/s  318.42 K/s tmux
23265 18160 14344  0.0  2.1  0:01.30  286.84 K/s    0.00 B/s  286.84 K/s postgres: 11/main: post
23264  7036  3992  0.0  0.8  0:00.03   78.95 K/s    0.00 B/s   78.95 K/s postgres: 11/main: Time
23262  7160  4116  0.0  0.8  0:00.04   71.05 K/s    0.00 B/s   71.05 K/

❯ vmstat 2
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 1  0      0  68588   2096 103156    0    0 28436     0 1787 4288  2  8 79 12  0
 0  1      0  57564    920 115364    0    0 24604    86 1676 3811  2  4 81 14  0
 0  0      0  70252   1156 102360    0    0 31750     0 1794 4337  3  8 75 15  0
 1  0      0  68632   2776 101380    0    0 38570    16 2139 4879  2 11 67 19  0
 0  0      0  67656    892 104940    0    0 29356    14 1706 3936  3  5 77 15  0
 0  0      0  68596    372 103368    0    0 50684     0 2324 5078  3 11 70 16  0
 0  0      0  69596    268 102512    0    0 35688    38 1890 4282  2  8 76 15  0
 0  1      0  69368    172 102540    0    0 35726    54 1877 4458  2  9 71 19  0
 0  1      0  69684   1912 100916    0    0 28724     0 1759 4235  3  7 74 16  0
 0  0      0  74380    768  97076    0    0 21198     0 1484 3762  2  5 80 13  0

❯ lsb_release -a
No LSB modules are available.
Distributor ID: Debian
Description:    Debian GNU/Linux 10 (buster)
Release:    10
Codename:   buster

原因是什么？

答案1

iotop会告诉你哪个进程正在读取。

一般来说，问题是由于缺少缓存造成的。

假设一个进程一遍又一遍地顺序读取同一个文件，并且这适合空闲内存。然后你将体验不到 I/O：所有 I/O 请求都将由磁盘缓存满足。

但如果只有 90% 的文件适合空闲内存（例如，因为空闲内存太小），那么突然没有任何的请求将被满足：这是因为缓存算法使用最近最少使用的：前 90% 适合内存，但是当读取最后 10% 时，前 10% 是最近最少使用的，因此会被刷新以使得最后10%的空间。

当再次读取前 10% 时，接下来的 10% 将是最近最少使用的，因此将被刷新。等等。

您可能没有遇到这种确切的情况，但也许您的进程一次又一次地从不同的文件中读取不同的部分 - 从而给出类似的结果。

答案2

不仅磁盘缓存可以从内存中清除。

内核可以逐出正在运行的应用程序的页面，只留下当前正在运行的应用程序。这可能会为需要运行大量代码的“胖”应用程序创建大量 IO。

相关内容