如何客观地比较两个文件的音质?

如何客观地比较两个文件的音质?

我使用 avconv 实用程序将从 Youtube 下载的 MP4 文件转换为 MP3:

$ avconv -i RembrandtPussyhorse.mp4 RembrandtPussyhorse.mp3
avconv version 0.8.9-6:0.8.9-0ubuntu0.12.10.1, Copyright (c) 2000-2013 the Libav developers
built on Nov  9 2013 19:12:35 with gcc 4.7.2
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'RembrandtPussyhorse.mp4':
Metadata:
    major_brand     : mp42
    minor_version   : 0
    compatible_brands: isommp42
    creation_time   : 2013-06-23 14:26:41
Duration: 01:03:42.60, start: 0.000000, bitrate: 167 kb/s
    Stream #0.0(und): Video: h264 (Constrained Baseline), yuv420p, 384x288, 69 kb/s, 25 fps, 25 tbr, 50 tbn, 50 tbc
    Stream #0.1(und): Audio: aac, 44100 Hz, stereo, s16, 96 kb/s
    Metadata:
    creation_time   : 2013-06-23 14:27:30
Output #0, mp3, to 'RembrandtPussyhorse.mp3':
Metadata:
    major_brand     : mp42
    minor_version   : 0
    compatible_brands: isommp42
    TDEN            : 2013-06-23 14:26:41
    TSSE            : Lavf53.21.1
    Stream #0.0(und): Audio: libmp3lame, 44100 Hz, stereo, s16, 200 kb/s
    Metadata:
    creation_time   : 2013-06-23 14:27:30
Stream mapping:
Stream #0:1 -> #0:0 (aac -> libmp3lame)
Press ctrl-c to stop encoding
size=   89594kB time=3822.65 bitrate= 192.0kbits/s    
video:0kB audio:89593kB global headers:0kB muxing overhead 0.000284%

$ ls -la
-rw-rw-r-- 1 dotancohen dotancohen  91743973 Dec 26 11:24 RembrandtPussyhorse.mp3
-rw-rw-r-- 1 dotancohen dotancohen  80171515 Jun 24  2013 RembrandtPussyhorse.mp4

请注意,MP3 文件(仅音频)现在比输入的 MP4 文件(音频和视频)更大。对这两个文件进行双盲听力测试会导致人们之间的结果一致(即同一个人说同一个文件听起来更好),但人们之间的结果不一致(即不同的人对哪个更好有不同的看法)。

有没有客观的方法来确定转换过程中音质是否下降?我没有原版 CD 可以比较。我确实意识到音质不可能增加,但如果有一个工具可以分析波形等并给出“质量”值,那么我会感兴趣。这需要在 Kubuntu Linux 上运行。谢谢。

答案1

如果您确实想要一个客观的衡量标准,请将两个文件加载到可以进行基本效果处理和混合的工具中(例如 Audacity),然后反转其中一个并将它们混合在一起。剩下的就是两个文件之间的差异 - 如果它们是相同的,则应该只剩下纯粹的静音。

答案2

识别两个文件之间的变化或退化最科学的方法是观察示波器上的波形。

您可以使用以下音频编辑程序大胆看看这两个文件中是否有任何剪辑。您可能还想对文件应用限制器或重放增益。

Foobar 有一个ABX 比较器可以对两个音频文件或剪辑进行盲目比较的工具。听众在播放曲目时进行指定次数的投票,结果显示在最后,这样听众在整个测试过程中就不会受到正确或错误答案的影响。

答案3

以防万一,除了其他答案(例如德里克·查尔斯's),步骤:

  1. 将音频/视频文件导入 Audacity(视频可能需要FFmpeg(英文):

  2. 对任意一个应用“反转”效果(即Audacity -> Menu -> Effect -> Special -> Invert);

  3. 匹配曲目的时间:

    在此处输入图片描述

  4. 选择两个曲目并创建它们的“混合”(例如Audacity -> Menu -> Tracks -> Mix -> Mix and Render to New Track):

    在此处输入图片描述

    如您所见,混音包含数据,这意味着音轨不相同。让我们再试一次。

  5. 以下混合听起来比较奇怪,空洞,沉默,或者孤独......不是吗?:

    在此处输入图片描述

    以防万一,“负”频谱图意味着它被“选中”(例如通过鼠标)。

  6. 让我们验证一下混音是否至少包含一些内容!为此,我们可以尝试检查振幅或“音量”的极值。为此,Audacity 有一个名为“放大”的效果(即Audacity -> Menu -> Effect -> Volume and Compression -> Amplify...):



    字段New Peak Amplitude表示-Infinity没有数据可供计算,因此“混合”轨道不存储音频 - 混合的来源是相同的。

  7. 瞧!


如果音轨完全相同,结果将为静音。要检查是否绝对静音,请选择完整(混音)音轨,然后打开“放大”效果。如果放大效果显示“新峰值振幅”为“-infinity”,则混音音轨完全静音,并且两个导入的文件具有相同的音频。

来源:atforum.audacityteam.org

答案4

您可以使用大胆打开文件并查看波形,这将是一个手动过程。

相关内容