分析10小时以上的录音的方法?

分析10小时以上的录音的方法?

我遇到过这样一种情况,我有一个很大的 mp3 文件,它是记者录音设备的输出,由于每次我去现场与人们交谈以获取事件报告等时都会忘记按下录音按钮,所以该设备会长时间运行。

基本上我有一个 11 小时的 mp3 文件,目前我正在分析它以找到我录制的录音。这需要几个小时,有时 4-5 小时。

那么有没有办法..
1. 从这个文件中单独获取语音记录
2. 消除或减少交通量/或其他背景噪音,如机器声音等,以便只从 mp3 中提取语音。

不确定这是否可能

谢谢

答案1

首先要明确一点:自动分析音频记录是一项非常复杂的任务。理论上可以区分语音和噪音,但我怀疑互联网上是否有一键式解决方案。这听起来更像是研究工作。

此外,您的录音可能没有完全无声的段落。如果是这样,可以在完全没有声音的点处分割文件 - 这也需要一些编程,我不记得有任何程序可以做到这一点。

寻找重要部分或有声音的部分

你可能想要使用一个(免费的,跨平台的)程序,例如大胆以便查看 MP3 的波形。使用波形,您可以看到“大多数”动作在哪里。

在此处输入图片描述

例如,我标记的褐色部分是超过一定阈值的部分。它们很可能就是您要查找的语音数据。

其他部分(蓝色)可能不包含任何相关信息或语音,因为它们的声音不如其他部分那么响亮。

还要注意中间的空白 - 这些空白可以帮助您识别实际上没有发生任何事情的部分。您可以剪切文件并将其拆分,以便获得不同的“采访”(或您正在录制的任何内容)。

消声

要消除噪音,您可以尝试使用均衡器效果并过滤掉某些频率。您需要进行试验,因为不是每个录音设备都相同,噪音条件也会发生变化。

话虽如此,您可以尝试提高 500Hz 到 1kHz(甚至高达 4kHz)之间的频率,并降低 500Hz 以下和 8kHz 以上的频率。

Audacity 还具有某些噪音消除过滤器,可消除静电、嘶嘶声、嗡嗡声或其他持续的背景噪音。试用这些过滤器。

相关内容