GNU Linux(ext4 和其他)如何找到最大的重复文件?

GNU Linux(ext4 和其他)如何找到最大的重复文件?

幸运的是查找重复文件的工具,但不知道任何输出可排序(按文件大小)列表的。

如何按文件大小排序找出前 30 个重复项?

必须理清 msort XD

fdupes -Sr . | grep "bytes each" -A 2 | sed "s/--/\n/g"

PS:花点时间静静从 src 编译 msort(2x 版本的 msort.utf8proc 仍然无法正常工作)

答案1

您可以使用工具 fdupes。

fdupes -Sr /tmp/

输出:

5 bytes each:                           
/tmp/file1
/tmp/file2

解释:https://linux.die.net/man/1/fdupes

  • -S显示重复文件的大小
  • -r包含子目录中的文件

答案2

解决方案:https://dwaves.de/2023/10/04/gnu-linux-debian-how-to-multi-line-sorting-madness-mlsm-how-to-output-x-blocks-of-text-separated-by-delimiter-build-bill-posers-and-bsds-msort-from-src/(按照那里的说明进行安装czkawka_cli,很高兴仍然有专门的博主:D)

czkawka_cli dup --directories /where/to/search/for/duplicates/ | less

自动按文件大小排序

相关内容