我想制作一种“语音识别”系统。
目标是将新录音与原始音频文件进行比较,如果声音 > x% 相似,则执行某些操作。
是否已经有一个工具可以做类似的事情?
答案1
嗯,我很高兴向您介绍语音识别world :) 事实上,关于这个主题有很多研究,但根本没有在 UNIX 系统中建立的工具。这是一篇包含广泛工具列表的帖子......即使实际上并不是有效的工具。 Linux下有什么好用的语音识别软件吗?
为了进行比较,您可以搜索龙自然说话,Windows 系统中明显的赢家。
答案2
答案3
唯一能够做到这一点的工具可能是shazam...但是,您不能将它用于自己的录音。您可能想看一下声学指纹识别!
答案4
我会用大胆,一款多功能音频软件。
如此处所述[1]您可以使用“反转”和“混合和渲染”工具。
有了这样的比较您将获得一个新的音轨,其中包含尽可能多的内容噪音输入文件的差异很大。
现在你可以分析它了视觉上或者你可以执行“绘制频谱" 并将结果导出为文本。