人类可以区分的最大音频比特率是多少?

人类可以区分的最大音频比特率是多少?

有些音频比特率高达 256kbps。但我用 92kbps 听过非常清晰的音乐。我开始怀疑,超过某个 x kbps 的比特率,普通人耳根本无法分辨出差异。x 是多少?

尽管这个问题不是 ubuntu 特有的,但它是因为我拆分了一个 ogg 开放格式问题而出现的。

mp3 转 ogg 的优势

答案1

比特率本身无法区分,因为它不是我们听到的音频信息的测量值。它是信息的大小编码器会删除它认为听不见的声音(因此,它是“可抛弃的”,没有或只有最小的可感知质量损失)。

好的编码器具有好的心理声学算法,这意味着它们会明智地选择如何去除高频和幅度太小而无法感知的频率,然后将“切碎”的波打包到给定的比特率中。比特率越高,编码器需要从原始音频中截取的就越少。

但如何可区分被删除的部分与算法(其心理声学模型)的决策关系更大,而不是与实际比特率有关。较差的编码器(如古代Xing)需要比好的编码器(如现代LAME)更高的比特率才能达到相同的水平感知质量。因为给定相同的位,它选择不好什么编码什么以及丢弃什么。

所以不是以与 CD 比特率相同的方式思考 MP3 比特率。在 CD 中,模拟声波只是数字编码,没有删除任何内容。因此,位数越多,声波就越准确。从比特率到感知准确度是 1-1 映射。也就是说不是使用 MP3(或 OGG)编码或任何依赖心理声学模型的有损编码均可实现。

此外,“可区分”是主观的:人类的听觉和高频灵敏度会随着年龄的增长而下降……所以你现在可能喜欢 96kpbs,但 10 年(或 20 年)前肯定“需要”更多。不同的人对高频(或小振幅)的区分不同。因此对于他们一个给定的编码器可能比另一个编码器更好,即使比特率较低。此外,设备和环境也起着关键作用:在路上的汽车里听音乐与在安静的房间里戴着高品质耳机听音乐是不一样的。

还有其他因素……特别是 VBR……这意味着比特率不断变化……对于需要更复杂编码的歌曲部分,比特率会上升到 320,而对于不需要删除任何内容的部分,比特率会下降到 96。因此,平均 128kpbs 的 VBR 文件通常会有很多比 160(甚至 192)恒定比特率 (CBR) 的质量更高。

也就是说,128kpbs可变比特率非常好为我,即使使用优质耳机也是如此。对于 CBR,192 足以保证透明度(意味着无法与原始无损 CD 音频区分开来。我今年 33 岁,并不是一名音响发烧友,因此您的感受可能会有所不同。

打个比方:

现在我想到一个很好的类比......它可能有助于理解为什么不可能确定“X kbps 超出了人耳可以分辨的范围”:

把音频想象成一所房子和里面的家具。你要搬到另一所房子。你的搬家卡车就是你的比特率:卡车越大,你就能把越多的家具装到新家。但由于这是单程旅行,卡车不够大,无法容纳所有东西,总会有一些东西被遗弃,因此而失去

你能分辨出东西丢了吗?你是否同意这在很大程度上取决于什么被选择留下的因素比卡车的大小更重要,即使更大的卡车确实有帮助?

您是否同意,不可能测量卡车的大小,以便“无法区分”,除非卡车足够大,可以容纳全部你的家具?(那将是无损编码,如 FLAC。这比最大的 MP3 大约大 5 倍)。

最后的话:

有人可能会说,客观测量人类的听力阈值是可能的。没错,你测量人耳的频率,确定频率必须达到多高才能听不见,或者给定声音可以比“主要”声音低多少 dB 才能无法区分。但你可以不是直接将其转换为比特率,因为编码(或丢弃)需要多少比特取决于给定歌曲中存在的比特数。

答案2

Hydrogenaudio 的论坛针对这个问题,我做过几次 ABX 测试。大多数人都无法始终如一分辨未压缩的源材料和 ~160kbps VBR 范围内的压缩文件之间的差异,但有些音乐确实很难准确压缩,有些人甚至擅长在 320kbps 的有损编码下听出差异。某些音乐答案是:视情况而定。

你的意思是192kbps 非常非常清晰吗?92kbps 的比特率有点低,我可以容易地分辨不出差别。除非你在嘈杂的环境中收听,质量不是那么重要(比如在公交车上收听便携式设备),否则我会避免曾经立体声音乐的 VBR 低于 ~128kbps。你牺牲了质量来节省一点空间,在我看来,这种权衡是不值得的。

降低到相当低的比特率(例如低于 80kbps)并保持可接受的质量单核细胞增多症音乐和演讲。

相关内容