我有一个录制的视频文件,其中声音从“正常音量”平滑地变为“低声细语”的音量。它几乎以正弦波的方式进行,因此,有 2 秒钟的正常音量,然后音量逐渐减弱 2-3 秒,保持低音量一秒钟,然后再次平滑地变大。因此,它没有声音峰值/裂纹,但这非常烦人,因为感觉就像麦克风在旋转木马上录音一样……
我已经看到 ffmpeg 有一些音频过滤,我最终得到了它,ffmpeg -i "input.avi" -filter:a loudnorm "output.mp3"
但它似乎仍然像“波浪状”的响亮和低语的声音。
我尝试过各种选项,ffmpeg -i "input.avi" -filter:a loudnorm=I=-24:LRA=2.0:TP=-0.0 "output.mp3"
但都一样。
你能帮我“均衡”(调平?标准化?我不确定这个词是否正确)这个视频的音量吗?
答案1
我不知道 ffmpeg 所以这不是一个完整的答案,而是“去哪里寻找答案”
您正在寻找的功能不是标准化。
您需要的是扩展、压缩和限制,或者更全面的自动增益或包络跟随器。
很多人对此感到困惑。标准化是通过提升全部将音轨作为一个单元调整到新的最高峰值。它不会影响声音的任何单个部分。如果要使用它,则在所有其他处理之后。它不是动态效果,而是静态效果。它就像一个整体音量旋钮,仅此而已。
当音量低于设定的阈值时,扩展会提高音量。当
音量高于设定的阈值时,压缩会降低音量。它有一个曲线来设置它执行此操作的强度。
限制就像非常硬的压缩,它可以“阻止”任何声音超过设定的阈值。
这些都作用于声音的每个微小部分 [可调],因此使用极端可能会严重影响最终结果,使一些不必要的背景噪音过于突出。
另一个选择是包络跟随器或自动增益,它将尝试在没有压缩的情况下执行此操作,通过自动“追逐”音量以保持其水平,就像旧式盒式录音机自动录音水平或 Windows 的自动麦克风增益的更好版本一样。
如果音量变化很大,您可能需要采用上述部分或全部方法。
所有这些处理器都适用于高端 DAW [数字音频工作站],有些可能以免费软件的形式提供,尽管我不知道任何具体来源。Audacity 是一款常用的免费音频编辑器,它有一系列可能合适的插件。
正如评论中提到的,VLC 有一个内置的压缩器,可能在某种程度上可以纠正这个问题,还有一个标准化器,你可以在之后用作补偿增益。
我认为对于其他任何事情,看看 ffmpeg 是否可以执行任何这些过程,或者提取音频并将其传输到专用音频包。