作为我们项目的一部分,我们应该对声音样本(存储为 .wav 文件)进行分类。所有样本都是相同的,只是纯语音(如 Skype 测试通话)。
流程如下:
参考 wav,这是“高质量”样本
比较大约1000 个 wav 文件
逐一计算与参考波形的偏差
有没有 Linux 工具可以做到这一点?
答案1
我相信你正在试图衡量什么(通过陈述分歧) 是个PESQ,每个文件的语音质量感知评估。这是 ITU-T 建议 P.862 的标准化形式 (02/01)http://en.wikipedia.org/wiki/PESQ。
您有不同的项目来实现您正在寻找的内容。例如 https://github.com/imankulov/speex-quality-evaluation