我知道文件有时会在复制过程中损坏,因此人们使用哈希值来检查它们。(MD5 或 CRC32 似乎可以解决随机错误)。
但通常,当我读到这个用例时,人们会谈论大的文件。我的假设是,这种损坏通常不会影响小文件,只会影响大文件。这个假设正确吗?
答案1
文件越大,发生损坏的机会就越多。
假设单个字节损坏的概率为 0.01%(帽子顶部的数字,仅用于演示的目的)。
- 1B 文件无错误的概率为 99.99% (100% - 0.01%)
- 100 B 文件无错误的概率约为 99.00% (99.99% 100 )
- 1 KiB(1024 B)文件无错误的概率约为 90.27%
- 10 KiB 文件无错误的概率约为 35.91%
- 1 MiB(1024 KiB)文件无错误的概率约为 0%
如您所见,随着文件大小的增加,出错的概率会迅速增加。这就是大文件更容易损坏的原因。但这并不意味着小文件不会受到损坏的影响。