我想分享一下我们的 rhel 7.6 服务器上的以下奇怪行为
当根文件系统大小为100G时,根文件系统几乎已满(已使用95%)
我们可以看到属于根文件系统的文件夹并没有消耗那么多
0 bin
145M boot
0 dev
50M etc
184K home
0 lib
0 lib64
0 media
0 mnt
698M opt
6.0M root
4.1G run
0 sbin
140K script
0 srv
0 sys
360K tmp
6.5G usr
还根据rhel -https://access.redhat.com/solutions/2316
我们也检查了(按照 rhel 的建议)
lsof / | egrep "deleted|COMMAND"
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
lsof /var | egrep "deleted|COMMAND"
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
但正如我们在上面看到的,没有条目行
我们还验证了
lsof +L 1
# lsof +L 1
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NLINK NODE NAME
java 44225 yarn 2436r REG 8,192 1084337 0 99222309 /DB/data1/hadoop/hdfs/data/current/38743643/current/finalized/subdir204/subdir193/blk_15230353883 (deleted)
java 44875 yarn 3298r REG 8,192 83 0 100139241 /DB/data2/hadoop/hdfs/data/current/38743643/current/finalized/subdir204/subdir196/blk_15230354434 (deleted)
但输出约为非根文件系统路径,所以它不相关
所以为了总结
在 rhel 系统上,根文件系统被某些未知进程填满。
无论从文件系统中移动或清除哪些文件,它都会继续。
参考 -
https://www.thegeekdiary.com/linux-filesystem-is-filling-尽管-no-large-files-or-directories/ https://access.redhat.com/solutions/2316
还有其他想法如何知道我们还可以验证什么吗?
另一个想法 - 是重新启动服务器,但这是最后的选择!