我已经了解了音频的位深度、频率和声道。相当容易理解,但找不到有关不同 PCM 格式的足够信息。
我确实了解这些数字与音频位深度相关。
这很重要,因为需要保留提取源中高于和低于人类听觉范围的音频。
以下是给出的一些选项:
PCM_ALAW
PCM_F32BE
PCM_F32LE
PCM_MULAW
PCM_S32BE
PCM_S32LE
PCM_U32BE
PCM_U32LE
答案1
16
– 每个样本占用 16 位32
– 每个样本占用 32 位
BE
– 每个样本以大端格式存储(字节顺序)LE
– 每个样本以小端格式存储
这很重要,因为需要保留提取源中高于和低于人类听觉范围的音频。
如果你谈论的是超出人类听觉范围的频率,那么采样频率就是最重要的参数。取你想要保留的最高频率,放弃高于这个频率的所有频率(见低通滤波器)并取样频率的两倍.此程序可防止混叠。
从理论上讲,保留低频声音(“低于人类听觉范围”)很容易,因为即使较差的采样频率也足够了。
但是您的硬件可能无法注册或播放极端频率。
如果“高于和低于人类听力范围”是指响度和安静度,那么你需要高动态范围. 在这种情况下,您可能更喜欢浮点数而不是整数。
据我所知,有符号与无符号以及大端与小端不会影响数字音频的质量;也就是说,您可以将有符号转换为无符号而不会丢失数据,大端与小端之间也是如此。这些设置需要在编码器和解码器之间匹配。
音频处理、模拟到数字转换的细节超出了超级用户的范畴。使用我提供的链接来促进您的研究。