为什么创建包含随机文本的文件比创建包含零的文件需要更长的时间？

Question 1

从输出中可以看出，这两种方法都非常快。但是，数据来源之间存在明显差异。

/dev/urandom这就是为什么从读取永远不可能像从读取一样快的原因/dev/zero。如果您有兴趣，维基百科文章关于/dev/random可以作为进一步阅读的起点。

Answer

从输出中可以看出，这两种方法都非常快。但是，数据来源之间存在明显差异。

/dev/urandom这就是为什么从读取永远不可能像从读取一样快的原因/dev/zero。如果您有兴趣，维基百科文章关于/dev/random可以作为进一步阅读的起点。

Question 2

您假设磁盘上的文件只是从输入设备输出的内容的逐字节副本。不一定是这样。

除了数据源（已在另一个答案中介绍）之外，性能上还存在另一个潜在差异 - 文件系统压缩、重复数据删除和稀疏文件的潜在创建。

如果您将一个只有零的文件写入压缩数据的文件系统，则此类文件系统所要做的就是不断更新所有这些零的“大小”。这可以非常快地完成，因为除了唯一的内容为零以及这些零的数量必须写入磁盘这一事实之外，没有任何信息。

真正的随机数据根本无法被压缩。

文件系统还可以“删除重复”块即使文件未压缩，尤其是 ZFS 等写时复制文件系统。在执行重复数据删除的文件系统上，只需将一个零块写入磁盘，然后只需添加对该块的引用。

随机数据非常非常不可能产生重复的块。

文件系统还可以检测到块的内容全为零并创建一个稀疏文件- 在哪里没有什么必须写入磁盘。

所有这些都比实际将所有零写入磁盘要快得多。

Answer