你们当中有人知道如何执行以下任务吗:假设您有两个目录树,我将其称为源和目标。它们的结构可能非常不同,但可能包含许多重复文件。
一个例子是,一方面是照片的结构化集合(目标),另一方面只是一个从相机中卸载所有内容的 tmp 目录(源)。
也许其中一些文件已经在结构化目录树中了。我想从源 rsync 到目标,这样只有源中不在目标中的文件在任何地点被复制。
答案1
尝试重复项:
fdupes 是 Adrian Lopez 编写的一款程序,用于扫描目录中的重复文件,并带有列出、删除或替换指向重复文件的硬链接的选项。它首先比较文件大小和 MD5 签名,然后逐字节检查以进行验证。
该维基百科条目也列出了类似的程序。
答案2
由于您的示例描述的是照片;Adobe Lightroom 正是这样做的。它可以将图片导入其目录结构,同时忽略重复项。但是,如果您想将此功能用于其他类型的文档,则需要另一种解决方案。