FFMPEG 从 MP3 转换为 FLAC - 为什么文件这么大？

Question 1

首先，我怀疑你误解了不同编解码器的用途。FLAC 的作用不是让音频“听起来”更好（尽管它可能听起来更好一点），而是用于存档音频。使用 FLAC，你可以反复解码和重新编码文件而不会损失任何质量。对于 mp3，如果你解码并重新编码几十次，最终结果将无法识别。将 mp3 编码为 FLAC 是没有意义的，因为它只会占用更多空间，而且听起来与 mp3 一模一样。

但要回答为什么：完整的答案非常复杂，需要了解信息理论。但我会尝试总结一下。

简短的回答：MP3 是有损的，而 flac 是无损的，这意味着 mp3 可以选择在数据中删除或插入信息，从而使压缩更有效率。FLAC 做不到这一点。

长答案：让我们使用英语作为压缩算法。遵循以下说明：

“将 1000000 个零写入文本文件”。

如果这样做，最终文件将约为 1Mb。但是使用英语，我能够将其描述（压缩）为一个简短的句子，如果写入文件则仅占用 32 个字节。让我们稍微改变一下这个句子。

“向文本文件中写入 500000 个零，然后写入一个 1，然后再写入 499999 个零”。

现在这个句子长得多（82 字节），并且生成的文件几乎完全相同，除了中间的一个值。中间的一个随机值使我们的句子（压缩数据）大了两倍多。您会看到，某事物越可预测，压缩效果就越好。数据的“可压缩性”取决于其“信息熵”或随机性。熵越高，压缩效果越差。压缩的极限是已知的，可以使用信息论来计算。

MP3 是有损的。这意味着它可以查看第二句话，并决定永远不会注意到文件中间的额外“1”，并将其更改为零，从而降低其熵，从而提高压缩率。但是现在 1 永远消失了，永远无法恢复。这个过程称为“量化”，这是 mp3 可以实现其压缩比的几个原因之一

但 mp3 也有相反的做法。由于 mp3 将数据转换为频域，并进行了心理声学优化，因此它在解码时实际上会增加 PCM 数据的熵。如果您随后将 PCM 用 FLAC 编码，FLAC 将保留增加的熵。

Flac 使用完全不同的压缩技术来确保熵被保留下来，而不会被量化。这意味着 flac 需要更多空间来编码文件。FLAC 不量化这一事实是其存在的首要原因，也是其主要特征。

Answer

首先，我怀疑你误解了不同编解码器的用途。FLAC 的作用不是让音频“听起来”更好（尽管它可能听起来更好一点），而是用于存档音频。使用 FLAC，你可以反复解码和重新编码文件而不会损失任何质量。对于 mp3，如果你解码并重新编码几十次，最终结果将无法识别。将 mp3 编码为 FLAC 是没有意义的，因为它只会占用更多空间，而且听起来与 mp3 一模一样。

但要回答为什么：完整的答案非常复杂，需要了解信息理论。但我会尝试总结一下。

简短的回答：MP3 是有损的，而 flac 是无损的，这意味着 mp3 可以选择在数据中删除或插入信息，从而使压缩更有效率。FLAC 做不到这一点。