我有一个旧文件夹,里面有很多东西。我觉得里面有很多重复的文件。
是否值得先进行 squashfs 备份?还是我应该直接使用 7zip 进行备份?
以下是我的备份技巧方法:
apt install -y squashfs-tools ;
cd /mnt/BackupDrive
mksquashfs /mnt/OldSourceDrive/ Backup-Deduped.squashfs
-keep-as-directory
答案1
先前的答案说 Squashfs 不进行重复检测,这是不正确的。Squashfs 会明确检测重复文件,并且只存储一次数据。这是在压缩之前进行的,与压缩完全无关。
顺便说一下,Mksquashfs 的输出会告诉您有多少个重复文件。
您还可以将默认压缩算法和块大小从 gzip 和 128K 更改为 128K。这将实现更好的压缩。
mksquashfs /mnt/OldSourceDrive/Backup-Deduped.squashfs -keep-as-directory -comp xz -b 1M
答案2
您特别提到您有重复文件,因此值得指出的是,一般来说,文件系统或存档压缩格式不会消除重复文件之间的冗余。 tar.gz 是例外,但即使如此,也不会对重复文件占用的空间产生很大影响。 如果重复文件是您想要压缩的主要原因,那么最好执行一些操作,例如运行重复文件查找器并删除或硬链接任何重复文件(请参阅这里)。
如果您只需要一次性压缩一堆内容,并且不需要持续访问以将新文件写入该存档,最简单的方法是将其压缩(您可以使用 7-zip)。请注意,如今大多数人的驱动器上的大部分空间都被无法压缩的文件格式(例如电影、照片)占用。