为什么从 MP3 到 WAV(PCM)的转换是无损的?

为什么从 MP3 到 WAV(PCM)的转换是无损的?

我理解,在音频格式之间进行转换时,如果不需要流编码,例如在 WAV (PCM)、AIFF、FLAC、ALAC、WMA Lossless 等之间进行转换,转换过程通常是无损的,因为 PCM 音频流只是被复制到新容器中。根据容器类型,它可能通过压缩算法来节省空间,但它仍然是逐位相同的数据。您也可以对 MP4(AAC) 文件执行相同的操作,方法是将 AAC 音频流复制到 MKA 容器文件中;这完全是无损的,因为没有对音频流进行重新编码。

我理解,当将前面列出的 WAV(PCM)、ALAC、FLAC 等格式转换为不支持音频流编码的格式时,转换应该涉及重新编码。例如,当转换为 MP3、MP4(AAC)、OGG(Vorbis)、WMA Lossy 等格式时,源音频流将被重新编码,因此数据将被丢弃。新文件的质量会更差。

我无法理解的是,为什么从 MP3 转换为 WAV (PCM) 是无损的(或 ALAC、FLAC 等)。音频流被重新编码,那么新的音频流的质量难道不会比 MP3 的音频流更差吗?请告诉我。

答案1

PCM 是最常用的音频编解码器之一;大多数计算机(以及许多设备)将其用作音频输出/输入的默认设置。此设备上听到的所有音频(无论是来自文件还是麦克风输入)都是 PCM 格式,用于重新生成原始模拟声音的近似值。

当您在使用 PCM 进行音频输出/输入的系统上使用麦克风进行数字音频录制时,音频流就是 PCM。当您将该录音无损保存为 WAV、FLAC、WMA Lossless、ALAC、AIFF 等时,无需编码过程,音频流只是放入新的容器文件中,它仍然是您的系统从模拟真实世界声音中解析出的 PCM 流。

无损格式可分为两种类型:压缩和未压缩。未压缩格式(如 WAV 和 AIFF)仅存储 PCM 音频流。压缩格式(如 FLAC、ALAC 和 WMA Lossless)通过压缩算法运行流数据以节省空间,就像 zip 存档一样。数据没有改变,只是存储效率更高;它仍然编码为 PCM。

如果您随后将无损导出的内容转换为 128kbps MP3,则需要重新编码。编码意味着以新的方式组织音频流数据;这是一个无损过程。但是,据我所知,没有编解码器可以做到这一点,因为这样做毫无意义。文件听起来会一样,播放需要对音频进行解码,这意味着需要更多的系统资源,并且文件大小与原始文件相同。因此,MP3、WMA Lossy、AAC、Vorbis (OGG) 等编解码器也会执行其他操作。常见的操作是丢弃被认为不太重要的数据。丢弃数据会使文件大小变小。

下面并不是一个完美的比喻,但我认为它表达出了要点。

假设I hate you Sarah!一张纸上写着“ ”,代表你录音后无损导出的WAV文件中的PCM音频流。

以不同的编码格式对数据进行编码相当于将字母打乱,形成“ h Iyae oSr! haatu”。解码软件知道此编解码器如何排列数据,因此可以对消息进行解乱。

但是,正如所讨论的,像 MP3 这样的格式也会在编码过程中丢弃数据。因此,MP3 消息更像是“ h I Sr! h tu”,而解码(未打乱)后,它将像这样“ I h t u S r h!”。如果您读回它,您仍然可以得到消息,但排除字母确实会稍微改变声音。您排除的越多,情况就越糟,直到您无法再理解原始消息。

MP3 音频流代表原始 PCM 音频流。播放 MP3 时,它会被解码回 PCM,但丢弃的数据显然不会返回。在这个例子中,重新添加缺失的字母听起来很有道理,但请记住,计算机并不像我们那么聪明,这是一个非常非常简单的例子。

如果您将 MP3 转换为 WAV 文件,从技术上讲,您是在解码为 PCM,然后保存 PCM 流,这就是 WAV 大于 MP3 的原因。没有数据丢失,因为 MP3 流始终只是 PCM 流的表示。编解码器规范告诉解码器如何将 MP3 解码回 PCM 格式。如果您将 MP3 转换为 128kbps AAC,实际发生的情况是 MP3 被解码为 PCM,然后 PCM 流被编码为 AAC。从 PCM 到 AAC 的编码过程会导致进一步的数据丢失,因为“ I h t u S r h!”被视为原始消息。请注意,字母没有挤在一起。制作 AAC 文件时,在尝试找出最安全的丢弃内容时,它不会知道排除字母中的空格不是消息的一部分,这就是为什么以相同比特率重新编码数据会导致质量下降的原因。

答案2

所以,你是说如果你将 MP3 转码为 WAV,它就是无损的?WAV 是一种未压缩的无损格式,而 MP3 是一种“有损”格式。有损格式总是经过压缩。当你从有损转码为无损时,你最终会得到一个看起来无损但实际上并非如此的文件。

您可以通过对文件应用“频谱分析”​​来检查这一点。下图显示了一个无损文件,该文件是从 MP3 转码而来的。您能看到 16 kHz 的架子吗?在未压缩的无损文件(如 WAV)中,架子不应该存在。

在此处输入图片描述

关于转码的非常好的信息:https://www.whatinterviewprep.com/prepare-for-the-interview/spectral-analysis/

相关内容