我经常rsnapshot
对桌面(在 Ubuntu 上运行 Ubuntu)上的主目录进行定期、自动快照,sda
并将它们保存到备用内部硬盘 ( sdb
)。有时,我会手动将rsync
内容复制(通过)sdb
到外部 USB SSD(称之为sdc
)。sdc
还包含我的文件的较旧的手动备份,这些备份早于我采用的rsnapshot
,因此其中有很多文件sdc
是传入rsnapshot
文件的重复项。
我最近发现了这个rdfind
工具(带有选项),它可以让我在手动从到进行快照后运行,从而-makehardlinks
大大减少磁盘使用量。然而,这需要冗余的 I/O 操作,因为我首先将文件从(写入约 250 GB),sdc
rdfind
rsync
sdb
sdc
rsync
sdb
然后运行rdfind
(释放几乎相同的 250 GB)。
原则上,应该可以运行类似的东西rdfind
前 rsync
检查哈希值并确定哪些文件sdb
需要写出以及哪些可以是硬链接 - 但如何写呢?
- 我正在寻找适用于 Linux 生态系统的通用解决方案,但也欢迎特定于发行版或文件系统的答案。
- 我的桌面运行 Ubuntu 22.04 并且都
sdb
使用sdc
BTRFS。 - 我的问题与这个问题不同,因为它涉及重复数据删除之间出发地和目的地,而不仅仅是出发地:rsync 的重复数据删除工具?
- 我知道硬链接文件的含义。