具有相同数量离散属性的同一类型两个文件的大小是否相同?

具有相同数量离散属性的同一类型两个文件的大小是否相同?

假设您有 2 个未压缩的 .RAW 图像文件,每个文件的大小均为 4096*4096 像素,但其中一个文件只有一种颜色(例如 #FF0000),而另一个文件包含蒙娜丽莎的片段。其余属性均相同。

  • 这两个 .RAW 文件的文件大小是否相同?
  • 对于包含完全相同样本数(3 分 3 秒,每秒 44,100 个样本)的 2 个 .WAV 文件,这是否也适用,但一个是降 B#,另一个是莫扎特安魂曲的 3 分钟摘录?
  • 那么如果有 2 个 .txt 文件,一个文件包含 10,000 个字母A,另一个文件包含《哈利波特》的前 10,000 个字符,那怎么样?
  • 是否有一个一般准则来衡量两个文件的大小差异,其中相同数量的数据以最低粒度存储(例如一个像素,一个样本或一个符号,基本上是可以描述所有内容变化的文件中最小的部分),但一个文件在每个部分都有相同的数据,而另一个文件有很多不同的数据?
  • 这取决于文件系统吗?

为了清楚起见,我说的是“实际大小”。我知道“磁盘上的大小”可以使差异更小甚至不存在。

答案1

RAW 文件通常与有损压缩格式(例如图像的 JPEG 和音频的 MP3)进行比较。RAW 格式保留了所有信息,因此是无损的。

但是,只要压缩不会丢失任何数据,无损 RAW 文件就可以压缩。在您的示例中,一个全色的 RAW 文件可以很容易地通过诸如运行长度编码之类的方法压缩到未压缩大小的一小部分。因此,您的问题的答案是,这取决于您使用的程序是否进行压缩。RAW 图像没有标准,每个相机制造商的做法都不同。

对于 WAV 文件,几乎总是没有压缩,因此无论内容如何,​​具有相同样本数的两个文件的长度都是相同的。对于未压缩的 Unicode、ASCII 或其他编码的文本文件也是如此。

文件系统也可以实现压缩。如果文件系统压缩数据,那么一个文件可能比另一个文件占用更少的磁盘空间。这取决于数据的可压缩程度。

相关内容