比较两个音频文件

比较两个音频文件

我想制作一种“语音识别”系统。

目标是将新录音与原始音频文件进行比较,如果声音 > x% 相似,则执行某些操作。

是否已经有一个工具可以做类似的事情?

答案1

嗯,我很高兴向您介绍语音识别world :) 事实上,关于这个主题有很多研究,但根本没有在 UNIX 系统中建立的工具。这是一篇包含广泛工具列表的帖子......即使实际上并不是有效的工具。 Linux下有什么好用的语音识别软件吗?

为了进行比较,您可以搜索龙自然说话,Windows 系统中明显的赢家。

答案2

虽然这是一个老问题,但我最近遇到了两个需要比较的音频文件。虽然这不是自动化过程,但我使用 Mixx 软件并比较波形。如果相同的话歌曲就相同。否则你应该能够看到差异(即使是较小的差异)。看这张图片1000vs3000比特率 - 顶部有两个波形,即使听上去歌曲相同,波形也表明它们之间实际上存在差异(但是小波形看起来相同);

答案3

唯一能够做到这一点的工具可能是shazam...但是,您不能将它用于自己的录音。您可能想看一下声学指纹识别

答案4

我会用大胆,一款多功能音频软件。
如此处所述[1]您可以使用“反转”和“混合和渲染”工具。
有了这样的比较您将获得一个新的音轨,其中包含尽可能多的内容噪音输入文件的差异很大。
现在你可以分析它了视觉上或者你可以执行“绘制频谱" 并将结果导出为文本。


[1] https://forum.audacityteam.org/viewtopic.php?t=82354

相关内容