提取音频,不明白 PCM 选项

提取音频,不明白 PCM 选项

我已经了解了音频的位深度、频率和声道。相当容易理解,但找不到有关不同 PCM 格式的足够信息。

我确实了解这些数字与音频位深度相关。

这很重要,因为需要保留提取源中高于和低于人类听觉范围的音频。

以下是给出的一些选项:

PCM_ALAW

PCM_F32BE

PCM_F32LE

PCM_MULAW

PCM_S32BE

PCM_S32LE

PCM_U32BE

PCM_U32LE

答案1

  • F– 每个样本存储为漂浮的观点数字
  • S– 每个样本均按签名方式存储整数
  • U– 每个样本存储为无符号整数

  • 16– 每个样本占用 16 位
  • 32– 每个样本占用 32 位

  • BE– 每个样本以大端格式存储(字节顺序
  • LE– 每个样本以小端格式存储


这很重要,因为需要保留提取源中高于和低于人类听觉范围的音频。

如果你谈论的是超出人类听觉范围的频率,那么采样频率就是最重要的参数。取你想要保留的最高频率,放弃高于这个频率的所有频率(见低通滤波器)并取样频率的两倍.此程序可防止混叠

从理论上讲,保留低频声音(“低于人类听觉范围”)很容易,因为即使较差的采样频率也足够了。

但是您的硬件可能无法注册或播放极端频率。


如果“高于和低于人类听力范围”是指响度和安静度,那么你需要高动态范围. 在这种情况下,您可能更喜欢浮点数而不是整数。


据我所知,有符号与无符号以及大端与小端不会影响数字音频的质量;也就是说,您可以将有符号转换为无符号而不会丢失数据,大端与小端之间也是如此。这些设置需要在编码器和解码器之间匹配。


音频处理、模拟到数字转换的细节超出了超级用户的范畴。使用我提供的链接来促进您的研究。

相关内容