GNU Linux（ext4 和其他）如何找到最大的重复文件？

2024-11-22 • tag-icon

linux storage ext4

GNU Linux（ext4 和其他）如何找到最大的重复文件？

幸运的是查找重复文件的工具，但不知道任何输出可排序（按文件大小）列表的。

如何按文件大小排序找出前 30 个重复项？

必须理清 msort XD

fdupes -Sr . | grep "bytes each" -A 2 | sed "s/--/\n/g"

PS：花点时间静静从 src 编译 msort（2x 版本的 msort.utf8proc 仍然无法正常工作）

答案1

您可以使用工具 fdupes。

fdupes -Sr /tmp/

输出：

5 bytes each:                           
/tmp/file1
/tmp/file2

解释：https://linux.die.net/man/1/fdupes

-S显示重复文件的大小
-r包含子目录中的文件

答案2

解决方案：https://dwaves.de/2023/10/04/gnu-linux-debian-how-to-multi-line-sorting-madness-mlsm-how-to-output-x-blocks-of-text-separated-by-delimiter-build-bill-posers-and-bsds-msort-from-src/（按照那里的说明进行安装czkawka_cli，很高兴仍然有专门的博主：D）

czkawka_cli dup --directories /where/to/search/for/duplicates/ | less

自动按文件大小排序

相关内容