原始（无头）音频文件的编码是什么以及如何编码？

Question 1

它可能会有所不同，但至少对我来说，text2wave 生成 1 通道、16 位、有符号整数 PCM。这些都是相当正常的——当你正确使用它们时就会非常清楚（例如，如果你错误地使用了无符号整数，你会得到极度扭曲的声音）

玩起来，看起来像：

play -r 16000 -b 16 -c 1 -e signed-integer /tmp/foo.raw
play -r 16000 -2 -s -c 1 /tmp/foo.raw # obsolete way for older versions of Sox

我怀疑这些参数是在 Festival 的某个地方配置的。其中一些也可能是硬编码的。

您可能遇到的唯一与体系结构相关的事情是大端与小端；在我的小端机器上 Festival 正在写入小端；如果我将该文件移动到大端机器上，我可能需要添加-L.如果text2wav在大端机器上运行，我不确定它是否会写入大端数据或小端数据。

Answer

它可能会有所不同，但至少对我来说，text2wave 生成 1 通道、16 位、有符号整数 PCM。这些都是相当正常的——当你正确使用它们时就会非常清楚（例如，如果你错误地使用了无符号整数，你会得到极度扭曲的声音）

玩起来，看起来像：

play -r 16000 -b 16 -c 1 -e signed-integer /tmp/foo.raw
play -r 16000 -2 -s -c 1 /tmp/foo.raw # obsolete way for older versions of Sox

我怀疑这些参数是在 Festival 的某个地方配置的。其中一些也可能是硬编码的。

您可能遇到的唯一与体系结构相关的事情是大端与小端；在我的小端机器上 Festival 正在写入小端；如果我将该文件移动到大端机器上，我可能需要添加-L.如果text2wav在大端机器上运行，我不确定它是否会写入大端数据或小端数据。

Question 2

使用aplay而不是play播放原始文件，这样您可以通过 -t 开关指定它是原始音频：

aplay -q -c 2 -t raw -f s16 test.raw

Answer

使用aplay而不是play播放原始文件，这样您可以通过 -t 开关指定它是原始音频：

aplay -q -c 2 -t raw -f s16 test.raw

Question 3

您也许可以创建自己的 RIFF 标头。稍微敲击一下就可以了……然后将标题放到你的其他部分上……

此链接显示标题布局：Canonical WAVE 文件格式

SO上还有一个相关链接：使用脚本将 RAW 音频数据转换为 WAV，但 mplayer/mencoder 答案的标记计数为零。然而，似乎索克斯作品。

索克斯在上述两个链接中都有提及，并且可以在 Ubuntu 的存储库中找到；我想其他人也是如此。

PS...我刚刚尝试使用play（不知道它存在）并发现它是 SoX！ ...SO 链接给出了一个示例，复制到此处：sox -r 44100 -e unsigned -b 8 -c 1 <RAW_FILE> <TARGET_FILE>

如果你不能让它工作袜队，也许 mplayer/mencoder 或 RIFF 标头会为您提供帮助。