在这里使用命令列出一些文件,find
如下所示:
find /dir1/ -type f -exec md5sum {} + | sort -k 2 > dir1.txt
然后:
find /dir2/ -type f -exec md5sum {} + | sort -k 2 > dir2.txt
注意到尽管是不同的文件,但仍有一些相同的哈希值,例如,xxxxxxxx.jpg
图像文件与yyyyyyyy.mp3
声音文件具有相同的哈希值。
主要问题是,文件比较的可信性级别是多少md5sum
?
答案1
md5sum 的碰撞概率为 1 in 2 64。参考这个帖子有关更多详细信息,请访问 crypto.se。
边注:文件的内容经过哈希处理,文件名在哈希处理中不起任何作用。您确定文件不同而不仅仅是名称不同吗?
$ md5 /tmp/files.txt*
MD5 (/tmp/files.txt) = 29fbedcb8a908b34ebfa7e48394999d2
MD5 (/tmp/files.txt.clone) = 29fbedcb8a908b34ebfa7e48394999d2