如何将 22.05 kHz 语音音频材料增强至 44.1 kHz 以供收听?

如何将 22.05 kHz 语音音频材料增强至 44.1 kHz 以供收听?

我在网上发现了一本非常有趣的广播小说,我想引起我的一位熟人的注意。不幸的是,音频材料质量很差,只有 22.05 kHz 和 1 个声道,单声道。但是它不包含音乐,只有语音。总的来说,它听起来像一台旧收音机或一部旧电话。如果可能的话,我想在发送给我的朋友之前对其进行一些改进。我应该使用什么软件,我应该对音频文件进行哪些操作才能使其听起来更好一些?

答案1

如果录制语音的采样率为 22kHz,则不能通过将其设置为 44kHz 来增强它。您可以将其与位图图像进行比较:通过“增大像素”,您不会获得更多细节。单声道/立体声也是如此。如果您有单声道录音,则无法将其转换为立体声录音。它只能反过来起作用,例如将立体声变成单声道。

但是,如果存在其他“问题”,例如录音的某些部分音量不够,您可能能够纠正这个问题或消除突然的变化等。但这取决于问题的类型,没有通用的解决方案。您应该熟悉该主题,以便知道“技术问题”是什么,然后尝试找到解决方案。如果您在应用此解决方案(即找到非常具体的声学问题的解决方案)时遇到问题,最好再次就该特定主题进行提问。

答案2

22.05 kHz 不是“低质量“就口语而言……大多数 Audible 库的采样率为 22.05 kHz - 即使是“高质量" 文件。

如果录音“听起来很糟糕“,那么可能是由于其他原因:

  • 位深度(8 位与 16 位)
  • 压缩(低比特率 MP3 与 AAC 或 OGG)
  • 麦克风(便宜 vs 不那么便宜)
  • 麦克风与阅读器的位置
  • 原始媒体(模拟与数字/磁带与迷你光盘或 PC)
  • 先前从低得多的采样率进行的上采样(这是您现在正在尝试做的)。

不管怎样,信息现在都丢失了,而且很难找回。你不用花太多时间就能做到的最好办法就是调整一下 EQ,让它听起来更让人接受。


您提供的样本对我来说听起来还不错(虽然我不会说这种语言,所以可能会错过一些细微差别......)。

我会稍微调整一下 EQ,正常化音频会将音量调高 — 您可能会发现,您认为的录音质量差,实际上是系统中的噪音,在将音量调高后变得更加明显。

波形变化如下所示(使用 Audacity),之前(顶部)和之后(底部):

Audacity 之前(上)和之后(下)

录音中有一些混响(可能是来自房间,也可能是离麦克风有点远)。但是背景噪音很小(因此波形部分较窄),没有失真,整个文件中只有一次爆音(上面没有显示)。

答案3

正如前面提到的,以 22.05kHz 录制口语本身并不“不好”,但也无法真正“修复”,因为录音中没有要强调的信息。您只能处理已有的内容。

解释一下... 人类的声音在 2 - 6 kHz 左右最为清晰。那里有所有的辅音,也真正有助于听众判断正在说什么;这也是为什么用手指堵住耳朵会降低可理解性的原因,它主要阻挡了这些较高的频率。6kHz
以上的语音中有信息,但在此之上信息就少了很多,到 11kHz 时,剩下的有用信息真的很少了。

因此,对于口语,他们使用 22.05kHz 作为采样频率。
有一种非常复杂的音频分析方法,称为奈奎斯特-香农采样定理通常简称为奈奎斯特极限,基本上可以归结为
“音频文件中可以记录的最高音频频率是采样频率的一半。”
这相当于 22.05kHz 录音中的 11kHz。
这对于人声来说已经足够了。

这也意味着,即使你将采样频率改为 44.1kHz [CD 音质],也不再有任何高于该频率的信息可供使用。

开始听有声读物。
据我所知,问题在于朗读者离麦克风有点近。这会强调较低的频率,因为有一种叫做邻近效应。这里无需详述,但总体而言,它使录音有点低音。
它也被某种程度地压缩了 - 动态范围减少了,因此安静的部分更响亮,而响亮的部分更安静。这应该有助于提高清晰度,但它并没有达到应有的效果,并且往往会更加强调低音。我能想到这样做的唯一理由是它让读者听起来“更有男子气概,更有权威”......但实际上对提高清晰度没有丝毫帮助 :/

我们需要做的是降低低音,强调高音,并尝试弱化一些重度压缩。
大部分可以或多或少可以在 Audacity 中完成,但我更喜欢在 Cubase 中完成,所以让我在那里向你展示......

大多数人会告诉你先对文件进行规范化。
不要先这样做- 你会失去你的潜在空间。
如果你真的需要这样做,那就去做吧最后的

还要注意,您无法“撤消”已经施加的压缩 - 这相当于从烤好的蛋糕中取回鸡蛋和面粉 - 相反,您只能尝试在受影响最严重的区域减轻它。

如果您只需要进行均衡,那么您可以尝试降低 250Hz 以下的音量,然后慢慢降低至低于该音量。然后,您可以尝试通过在高于 2 或 3 kHz 处添加相反的斜率来恢复一些辅音。

我在大约 3:40 时听到了令人恼火的咔嗒声或咂嘴声,我只需选择并调至零 - 你可以用消除咔嗒声器来巧妙解决,但不值得付出努力。

对于任何此类救援行动,我首选的武器是多频段压缩器。
我找到了一款适用于 Audacity 的免费多频段压缩器,但我自己还没有尝试过,所以 YMMV -https://www.gvst.co.uk/gmulti.htm

我使用价格昂贵得多的 Waves LinMB,但总体思路是一样的。这是我的设置方式...

在此处输入图片描述

从图片中,你可以看到我非常用力地敲打低音,试图消除过度的轰鸣声。中间部分我基本没动。我增加了高音的输出水平,同时施加了轻微的压缩,这样一些较重的 S 等就不会太过有力。此外,此时我还没有增加整体音量 - 我们仍然有足够的余量可以发挥,最好在打开和关闭效果进行比较时不要只是用音量变化来欺骗自己。

简单示例-
之前...

https://soundcloud.com/graham-lee-15/antal-vegh-orig?in=graham-lee-15/sets/intelligibility-fix

后...

https://soundcloud.com/graham-lee-15/antal-vegh-linmb?in=graham-lee-15/sets/intelligibility-fix

到了这一步,一旦你对声音感到满意了,现在你可以正常化。

请注意,我的示例采用较高的采样率,纯粹是因为我无法直接以 22.05 导出。这不会以任何方式对结果产生实质性影响。

答案4

使用开源软件 Audacity。以下是链接https://www.audacityteam.org/

查看以下链接,看看是否可以采取一些措施来改善您的特定音频 https://www.wikihow.com/Get-Higher-Audio-Quality-when-Using-Audacity

相关内容