有没有一种方法可以客观地测量两个音频文件之间的质量差异——通过“科学”测量,而不是用耳朵或意见?
我有两个文件——一个以 768kb/s 编码,另一个以 1536kb/s 编码。我想知道是否有办法确定一个文件的质量比另一个高多少。是否可以在某种音频分析程序中打开它们并检查剪辑、分辨率等?
答案1
你能客观的说出品质吗?
一般来说,没有准确的方法来客观地、精确地衡量音频质量。简而言之:如果不询问一组人他们的具体评分,你永远无法量化一段音频的质量比另一段音频“高多少”。质量本身就是绝不绝对的——这是非常主观的。
研究人员通常采取以下方法来缓解这一问题:他们定义一个量表,让一组人根据这个量表对质量进行评分,比如 5.1(坏的,贫穷的,公平的,好的,出色的)或者你也可以简单比较某些编解码器(但这不会给你提供非常有意义的数据)。然后,研究人员使用这些评级来建立计算机指标模型,以预测人类的反应。
客观质量指标
一个相当古老但流行的客观音频质量指标是音频质量感知评估 (PEAQ),描述于国际电联无线电标准 BS.1387(1998)。基本上,它试图模仿人耳并生成 1 到 5 的意见分数,就像人类听众一样。聚醚醚酮从 2006 年开始,这是一个较新的指标,据称其表现优于 PEAQ。
这些指标通常在单个声音或语音上进行测试,而不一定在音乐上进行测试,因为从复杂声音中估计感知质量要困难得多,而复杂声音中的掩蔽效应更为普遍。这是 2008 年的指标更针对音乐。
在我看来,音频质量指标的研究并不像视频质量指标(我正在研究的一个主题)那么活跃。你很难找到一个可以在 Windows 上使用的独立工具,只需插入两个音频源即可获得结果。大多数指标都是在研究机构内部开发的,很少向公众公布。或者它们是商业工具对于广播公司和电信提供商来说。
这是一个PEAQ 的 MATLAB 实现,但这就是我所知道的全部了。
你能比较文件时做什么
从技术角度来看这个问题,值得一提的是能理论上,只需查看数据速率即可猜测哪个文件的质量更好。然而,只有当文件包含相同的源内容,并且使用相同的编码器进行编码时,这种方法才可靠。
这就是编解码器收听测试背后的整个想法:你采用相同的源,用不同的编码器将其编码为不同的数据速率(或质量级别),然后让用户进行比较。有了这些“基本事实”数据,你可以说,例如,用 LAME 以 128 kBit/s 编码的 MP3 文件听起来和用 FAAC 以 64 kBit/s 编码的 AAC 文件一样好(这些是虚构的数字,但你明白我的意思)。
如果您知道这两个文件使用了相同的编码器,那就更容易了,因为很有可能数据速率(文件大小)足以对最终的质量做出有根据的猜测。
但话又说回来,这只有在源相同的情况下才有效。有些编解码器对不同类型的音乐或语音表现更好。有些编解码器在较低比特率下效果更好,但在较高比特率下不一定能提供更好的质量。有太多因素需要考虑。
答案2
最好的衡量标准是格式和采样率。虽然文件大小可能会给你一些启发。
事实上,我们需要认识到,录音质量的差异可能并不意味着听起来最好,而只是意味着对原始录音的保真度更高。
格式 -MP3 不会具有与 FLAC 等无损格式相同的质量,并且根据编解码器中的其他因素,两种有损格式可能会根据压缩方式和压缩方式产生不同的结果
采样率将决定每秒从录音中获取信息并播放的频率,显然 1Hz 的质量很差,而 24kHz 听起来不错。频率越高越好。
位深度这类似于处理器,每个样本可以记录 x 位。位数越多,信息越多,录音质量就越好。
文件大小是录音质量的结果。其中采样率、位深度、通道和压缩是文件大小的组成部分。您可以计算示例亲自看看吧。
我在此声明,这可能对某些录音无关紧要。如果你正在听 40 年代的录音,那么无论如何它都会是一份质量很差的录音。你不能通过增加上述任何一项来将原始格式不包含的信息添加到新录音中。
答案3
您可以在音频编辑程序中打开它们,缩小到单个(数字)波,然后将像素与原始图像进行交叉比较。
使用这个程序时,我经常会看到阶梯状的现象,并且很容易出现剪辑,这通常是由于编码速率很差或质量很差,或两者兼而有之。
当你说话频率很高时,要想更深入,就必须从视觉上比较其中的一部分。对于应该相似的声音,有差异化方法,可以用另一个声音片段去除一个声音片段,剩下的就是它们之间的变化。其中一个噪声过滤器可以轻松做到这一点,我相信还有其他方法,比如负混合,其中声音的完美克隆将使视觉线归零。
我认为反转“相位”并进行加法混合也能达到这一目的。完美克隆与原始反向混合的最终结果应该是一条完全平坦的线,播放时没有声音输出。测试理论并制定计划很容易,首先使用完全相同的声音片段,然后尝试用压缩片段做同样的事情。
想象一下,在照片程序中,您可以加载您正在处理的完全相同图片的 Jpeg 压缩版本,进行差异叠加。将剪辑与原始剪辑对齐,所有瑕疵、块和颜色变化都会立即显示为颜色和颜色级别,与原始剪辑 100% 相同的所有内容都是纯黑色。使用音频编辑器,您可以对音频执行相同的操作。
答案4
如果您没有任何形式的无损原版,您可以用耳朵比较两首有损编码音乐的质量。