使用 FFmpeg 的 VBR 将 mp3 转换为 wav

使用 FFmpeg 的 VBR 将 mp3 转换为 wav

我应该使用什么命令将文件转换mp3wav比特率可变的。或者更好的是,我如何知道源音频是fixed比特率还是variable

答案1

您可以使用该ffprobe song.mp3命令获取有关输入文件比特率的一些信息。但是,这只会告诉您第一帧的比特率。MP3 文件中的 VBR 通常通过更改每帧的比特率来实现,因此无法仅通过读取第一帧的标题来确定是否正在使用 VBR。我通常使用其他音频文件播放器软件来确定是否正在使用 VBR,因为许多软件都会显示该信息(例如 Foobar2000)。

当您使用有损输出编解码器(例如 MPEG-1 Layer III 或 AAC)时,ffmpeg 会为输出流选择默认比特率或可变比特率。这取决于编码器本身。

对于无损编解码器,您无法设置可变比特率,因为每个样本都采用预定义的位数。ffmpeg -i song.mp3 song.wav因此将获得PCM编码采样率为 44,100 Hz、每样本 16 位的 WAV 文件。这导致整个容器的速率约为 1411 kBit/s,可能比 MP3 输入文件大得多。

如果您希望 PCM 编码的 WAV 文件的文件大小较小,请设置位深度较低的采样格式(请参阅-encoders选项以获取完整列表)和/或选择较低的采样率(-ar 22050例如使用 22.05 kHz)。

以下是同时执行这两项操作的示例:

ffmpeg -i song.mp3 -acodec pcm_u8 -ar 22050 song.wav

答案2

根据@naught101的评论,我将遵循此过程来检测最佳方法acodec

$ ffmpeg -formats | grep PCM 

 DE f32be           PCM 32-bit floating-point big-endian
 DE f32le           PCM 32-bit floating-point little-endian
 DE f64be           PCM 64-bit floating-point big-endian
 DE f64le           PCM 64-bit floating-point little-endian
 DE s16be           PCM signed 16-bit big-endian
 DE s16le           PCM signed 16-bit little-endian
 DE s24be           PCM signed 24-bit big-endian
 DE s24le           PCM signed 24-bit little-endian
 DE s32be           PCM signed 32-bit big-endian
 DE s32le           PCM signed 32-bit little-endian
 DE u16be           PCM unsigned 16-bit big-endian
 DE u16le           PCM unsigned 16-bit little-endian
 DE u24be           PCM unsigned 24-bit big-endian
 DE u24le           PCM unsigned 24-bit little-endian
 DE u32be           PCM unsigned 32-bit big-endian
 DE u32le           PCM unsigned 32-bit little-endian

此时,请考虑您的平台,在big-endian、之间进行选择little-endian,选择比特率:

$ ffmpeg -i sample.mp3 
[mp3 @ 0x7fb33180da00] Estimating duration from bitrate, this may be inaccurate
Input #0, mp3, from 'sample.mp3':
  Metadata:
    title           : Saturday
    artist          : Winterwood
    album           : Love In The Heart
    track           : 2/15
    TPA             : 1/1
    encoded_by      : iTunes 11.0.1
    genre           : Country & Folk
    date            : 1997
  Duration: 00:04:27.76, start: 0.000000, bitrate: 128 kb/s
    Stream #0:0: Audio: mp3, 44100 Hz, stereo, s16p, 128 kb/s

我们可以看到,这个音频文件是一个mp3(这并不明显,尽管输入文件的扩展名不同,只需检查字节数)的比特率为128 kb/s,编解码器为s16p,采样率为44100 Hz,因此我们进行相应的选择:

$ ffmpeg -i sample.mp3 -acodec pcm_s16le -ar 44100 sample.wav


Input #0, mp3, from 'sample.mp3':
  Metadata:
    title           : Saturday
    artist          : Winterwood
    album           : Love In The Heart
    track           : 2/15
    TPA             : 1/1
    encoded_by      : iTunes 11.0.1
    genre           : Country & Folk
    date            : 1997
  Duration: 00:04:27.76, start: 0.000000, bitrate: 128 kb/s
    Stream #0:0: Audio: mp3, 44100 Hz, stereo, s16p, 128 kb/s
File 'sample.wav' already exists. Overwrite ? [y/N] y
Output #0, wav, to 'sample.wav':
  Metadata:
    INAM            : Saturday
    IART            : Winterwood
    IPRD            : Love In The Heart
    IPRT            : 2/15
    TPA             : 1/1
    ITCH            : iTunes 11.0.1
    IGNR            : Country & Folk
    ICRD            : 1997
    ISFT            : Lavf56.4.101
    Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 44100 Hz, stereo, s16, 1411 kb/s
    Metadata:
      encoder         : Lavc56.1.100 pcm_s16le
Stream mapping:
  Stream #0:0 -> #0:0 (mp3 (native) -> pcm_s16le (native))
Press [q] to stop, [?] for help
size=   46125kB time=00:04:27.75 bitrate=1411.2kbits/s    
video:0kB audio:46125kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.000457%

如果您使用的是 Mac,您可以检查音频的开头/结尾是否没有音频white noise(当 mp3 原始音频在几毫秒/秒内没有音频时):

$ afplay sample.wav

当然,你可以仔细检查位图:

$ ffmpeg -i sample.wav
Input #0, wav, from 'sample.wav':
  Metadata:
    artist          : Winterwood
    date            : 1997
    genre           : Country & Folk
    title           : Saturday
    album           : Love In The Heart
    track           : 2/15
    encoder         : Lavf56.4.101
    encoded_by      : iTunes 11.0.1
  Duration: 00:04:27.76, bitrate: 1411 kb/s
    Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 44100 Hz, 2 channels, s16, 1411 kb/s

答案3

使用 ffmpeg 转换媒体,首先使用 ffprobe 检查文件规范。使用此命令 ffmpeg -i kimberly.wav -acodec pcm_s16le -ar 16000 -ac 1 song.wav

在哪里 -pcm_s16le is codec 16 bit conversion -ar is sampling rate (16000samples/sec) -ac no of audio channel

相关内容