如何在Linux上有效删除数十亿个文件？

Question 1

如果无法访问系统并且没有进行实验，就很难检查什么有效、什么有帮助、什么无用；但我的方式是这样的：

简而言之：不要删除不需要的文件，而是将mv它们删除到目录（这必须是一个快速操作），然后将此处的文件截断为 0 大小（以收回空间）；稍后您可以rm查看目录（以完全删除文件并取回索引节点）；这 3 个阶段中的每个阶段都可以根据系统负载并行或顺序完成。

详细信息：
创建一个目录 X。
在一个 shell 脚本 S1 中，mv大约 N=500 个不需要的文件放入 X/latest 并将其重命名为 X/X1，mv接下来的 N 个不需要的文件放入 X/latest 并将其重命名为 X/X2，mv接下来的 N 个不需要的文件文件放入 X/latest 并将其重命名为 X/X3 ....
在另一个 shell 脚本 S2 中，进入每个具有 N 个文件的目录 X/X1 、 X/X2 、 X/X3 并将文件截断为 0 大小并重命名目录 X/0X1、X/0X2、X/0X3 ....
在最后一个 shell 脚本 S3 中，rm目录 X/0X1 、 X/0X2 X/0X3 ....

在这里，目录命名确保每个 shell 脚本都是独立的，不会干扰其他脚本：S1 与 X/latest 一起工作； S2 与 X/X1、X/X2、X/X3 ... 配合使用； S3 可与 X/0X1、X/0X2、X/0X3 ... 配合使用：无冲突！

检查这 3 个阶段中的每一个是否可以根据系统负载并行或顺序完成。改变 N 并使用nice&ionice来sleep控制系统负载。

替代建议：
使用新位置来存储较新的修订版本，并让用户默认在此处查看。您甚至可以使用过去 1 个月生成的修订来填充此新位置 (cp或)。万一，一个用户想要“所有修订”，则只能访问旧位置。这将确保旧位置不会增长。然后，您可以轻松地轻松删除不需要的非常旧的修订版，而无需系统负载。mv

rm

Answer

如果无法访问系统并且没有进行实验，就很难检查什么有效、什么有帮助、什么无用；但我的方式是这样的：

简而言之：不要删除不需要的文件，而是将mv它们删除到目录（这必须是一个快速操作），然后将此处的文件截断为 0 大小（以收回空间）；稍后您可以rm查看目录（以完全删除文件并取回索引节点）；这 3 个阶段中的每个阶段都可以根据系统负载并行或顺序完成。

详细信息：
创建一个目录 X。
在一个 shell 脚本 S1 中，mv大约 N=500 个不需要的文件放入 X/latest 并将其重命名为 X/X1，mv接下来的 N 个不需要的文件放入 X/latest 并将其重命名为 X/X2，mv接下来的 N 个不需要的文件文件放入 X/latest 并将其重命名为 X/X3 ....
在另一个 shell 脚本 S2 中，进入每个具有 N 个文件的目录 X/X1 、 X/X2 、 X/X3 并将文件截断为 0 大小并重命名目录 X/0X1、X/0X2、X/0X3 ....
在最后一个 shell 脚本 S3 中，rm目录 X/0X1 、 X/0X2 X/0X3 ....

在这里，目录命名确保每个 shell 脚本都是独立的，不会干扰其他脚本：S1 与 X/latest 一起工作； S2 与 X/X1、X/X2、X/X3 ... 配合使用； S3 可与 X/0X1、X/0X2、X/0X3 ... 配合使用：无冲突！

检查这 3 个阶段中的每一个是否可以根据系统负载并行或顺序完成。改变 N 并使用nice&ionice来sleep控制系统负载。

替代建议：
使用新位置来存储较新的修订版本，并让用户默认在此处查看。您甚至可以使用过去 1 个月生成的修订来填充此新位置 (cp或)。万一，一个用户想要“所有修订”，则只能访问旧位置。这将确保旧位置不会增长。然后，您可以轻松地轻松删除不需要的非常旧的修订版，而无需系统负载。mv

rm

Question 2

您可以使用较大的提交间隔（这相对节省但可能没有帮助）或使用nobarrier（应该有帮助）挂载分区，这在断电或内核崩溃方面极其危险。

异步 I/O 魔法可能会有所帮助，但我无法推荐任何工具。

Answer

您可以使用较大的提交间隔（这相对节省但可能没有帮助）或使用nobarrier（应该有帮助）挂载分区，这在断电或内核崩溃方面极其危险。

异步 I/O 魔法可能会有所帮助，但我无法推荐任何工具。

如何在Linux上有效删除数十亿个文件？

答案1

答案2

相关内容