我们的一个繁忙网站有一个非常大(多 GB)的 Nginx 缓存目录,有时我们需要一次性清除所有缓存。我过去曾通过将缓存文件夹移动到新路径、在旧路径上创建新缓存文件夹,然后rm -rf
删除旧缓存文件夹来解决这个问题。
然而,最近,当我需要在繁忙的早晨清除缓存时,I/O 导致rm -rf
我的服务器进程无法访问磁盘,因为 Nginx 和它所面向的服务器都是读取密集型的。我可以看到平均负载上升,而 CPU 处于空闲状态,rm -rf
占用了 98-99% 的磁盘 IO iotop
。
我曾尝试ionice -c 3
调用rm
,但似乎对观察到的行为没有明显的影响。
有什么方法可以驯服rm -rf
以共享更多磁盘吗?我是否需要使用另一种可以从中获取线索的技术ionice
?
更新:
有问题的文件系统是 AWS EC2 实例存储(主磁盘是 EBS)。/etc/fstab
条目如下所示:
/dev/xvdb /mnt auto defaults,nobootwait,comment=cloudconfig 0 2
答案1
所有数据均从本页面收集。 以下是删除大型文件目录的一些选项。查看文章以了解其实现方式的详细信息。
命令已用系统时间 %CPU cs1* (Vol/Invol) rsync -a –删除空/a 10.60 1.31 95% 106/22 查找 b/ -类型 f -删除 28.51 14.46 52% 14849/11 查找 c/-type f | xargs-L 100 rm 41.69 20.60 54%37048/15074 查找 d/-type f | xargs -L 100 -P 100 rm 34.32 27.82 89% 929897/21720 rm -rf f 31.29 14.80 47% 15134/11
*cs1 是上下文切换自愿和非自愿
答案2
删除文件仅对文件系统执行元数据操作,不受 ionice 的影响。
最简单的方法是,如果您现在不需要磁盘空间,则可以rm
在非高峰时段执行。
更复杂的方法可能会奏效,即随着时间的推移分散删除操作。您可以尝试以下方法(请注意,它假定您的路径和文件名不包含任何空格!):
while find dir -type f | head -n 100 | xargs rm; do sleep 2; done
while find dir -type d -depth | head -n 100 | xargs rmdir; do sleep 2; done
还要注意,您不能rm -f
在第一个命令中使用,因为循环不会停止(这取决于rm
没有参数时的错误退出代码)。
您可以通过修改每个周期的删除次数(示例中为 100)和休眠持续时间来调整它。但是,这可能不起作用,因为文件系统可能仍会将元数据更新聚集在一起,从而导致您的 IO 负载出现问题。您只需尝试一下。
答案3
您可以将它与“nice”命令配对。
ionice -c 3 nice -19 rm -rf /some/folder
这会改变机器上进程的优先级。