我有两个媒体文件,想要使用 ffmpeg 将它们合并。
- 文件 1 包含音频和视频,开始于时间 = 0 秒。
- 文件 2 仅包含音频,该文件的开始时间为 2.5 秒。
如何使用 ffmpeg 合并这些文件,并使音频文件正确偏移?
这是我尝试过的:
ffmpeg -i video_and_audio.webm -itsoffset 2.5 -i audio_only.webm -filter_complex amix out.webm
这样得到的音频/视频文件的长度似乎正确,并且两个文件的音频混合在一起,但音频与纯音频文件的偏移不正确。纯音频文件的开始时间似乎为 0,就好像没有 itsoffset 参数一样。我还尝试了 itsoffset 之后的其他值,认为单位可能实际上不是秒。即使值为 2500,纯音频文件似乎仍会立即开始。
ffmpeg 输出似乎是常见的请求:
ffmpeg version 2.8.2 Copyright (c) 2000-2015 the FFmpeg developers
built with gcc 4.8 (SUSE Linux)
configuration: --shlibdir=/usr/lib64 --prefix=/usr --mandir=/usr/share/man --libdir=/usr/lib64 --enable-shared --disable-static --enable-debug --disable-stripping --extra-cflags='-fmessage-length=0 -grecord-gcc-switches -O2 -Wall -D_FORTIFY_SOURCE=2 -fstack-protector -funwind-tables -fasynchronous-unwind-tables -g' --enable-pic --optflags='-fmessage-length=0 -grecord-gcc-switches -O2 -Wall -D_FORTIFY_SOURCE=2 -fstack-protector -funwind-tables -fasynchronous-unwind-tables -g' --enable-gpl --enable-x11grab --enable-version3 --enable-pthreads --datadir=/usr/share/ffmpeg --enable-avfilter --enable-libpulse --enable-libwebp --enable-libvpx --enable-libopus --enable-libmp3lame --enable-libvorbis --enable-libtheora --enable-libspeex --enable-libxvid --enable-libx264 --enable-libx265 --enable-libschroedinger --enable-libgsm --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-postproc --enable-libdc1394 --enable-librtmp --enable-libfreetype --enable-avresample --enable-libtwolame --enable-libvo-aacenc --enable-gnutls --enable-libass --disable-decoder=dca --enable-libdcadec --enable-frei0r --enable-libcelt --enable-libcdio --enable-ladspa
libavutil 54. 31.100 / 54. 31.100
libavcodec 56. 60.100 / 56. 60.100
libavformat 56. 40.101 / 56. 40.101
libavdevice 56. 4.100 / 56. 4.100
libavfilter 5. 40.101 / 5. 40.101
libavresample 2. 1. 0 / 2. 1. 0
libswscale 3. 1.101 / 3. 1.101
libswresample 1. 2.101 / 1. 2.101
libpostproc 53. 3.100 / 53. 3.100
Input #0, matroska,webm, from 'video_and_audio.webm':
Metadata:
encoder : GStreamer matroskamux version 1.5.91
creation_time : 2015-11-23 02:57:26
Duration: 00:01:20.78, start: 0.000000, bitrate: 323 kb/s
Stream #0:0(eng): Video: vp8, yuv420p, 480x640, SAR 1:1 DAR 3:4, 1k tbr, 1k tbn, 1k tbc (default)
Metadata:
title : Video
Stream #0:1(eng): Audio: vorbis, 48000 Hz, stereo, fltp (default)
Metadata:
title : Audio
Input #1, matroska,webm, from 'audio_only.webm':
Metadata:
encoder : GStreamer matroskamux version 1.5.91
creation_time : 2015-11-23 02:58:46
Duration: 00:01:17.11, start: 0.000000, bitrate: 79 kb/s
Stream #1:0(eng): Audio: vorbis, 48000 Hz, stereo, fltp (default)
Metadata:
title : Audio
[libopus @ 0x16c3320] No bit rate set. Defaulting to 96000 bps.
[libvpx-vp9 @ 0x16bd800] v1.3.0
Output #0, webm, to 'out.webm':
Metadata:
encoder : Lavf56.40.101
Stream #0:0: Audio: opus (libopus), 48000 Hz, stereo, flt, 96 kb/s (default)
Metadata:
encoder : Lavc56.60.100 libopus
Stream #0:1(eng): Video: vp9 (libvpx-vp9), yuv420p, 480x640 [SAR 1:1 DAR 3:4], q=-1--1, 200 kb/s, 1k fps, 1k tbn, 1k tbc (default)
Metadata:
title : Video
encoder : Lavc56.60.100 libvpx-vp9
Stream mapping:
Stream #0:1 (vorbis) -> amix:input0 (graph 0)
Stream #1:0 (vorbis) -> amix:input1 (graph 0)
amix (graph 0) -> Stream #0:0 (libopus)
Stream #0:0 -> #0:1 (vp8 (native) -> vp9 (libvpx-vp9))
Press [q] to stop, [?] for help
Input stream #0:0 frame changed from size:480x640 fmt:yuv420p to size:360x480 fmt:yuv420p
[libopus @ 0x16c3320] Queue input is backward in time30.41 bitrate= 265.3kbits/s
Input stream #0:0 frame changed from size:360x480 fmt:yuv420p to size:240x320 fmt:yuv420p
[libopus @ 0x16c3320] Queue input is backward in time00.28 bitrate= 254.3kbits/s
frame= 1077 fps=4.9 q=0.0 Lsize= 2433kB time=00:01:20.79 bitrate= 246.7kbits/s
video:1660kB audio:738kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 1.456821%
答案1
我已经成功使用adelay
过滤器来执行此操作。命令如下:
ffmpeg \
-i video_and_audio.webm \
-i audio_only.webm \
-c:v copy \
-filter_complex '[1:a] adelay=2500|2500 [delayed]; [0:a] [delayed] amix [out]' \
-map 0:v \
-map '[out]' \
out.webm
请注意,使用adelay
过滤器时,延迟必须以毫秒为单位指定,并且必须为每个音频通道单独指定。在此示例中,音频是立体声(2 通道),因此延迟指定了两次。
逐行解释:
- 第一个输入文件
- 第二个输入文件
- 将视频直接复制到输出,无需进行任何更改
- 复杂的滤波器,它接收第二个输入的音频,延迟它,然后将其与第一个输入的音频混合
- 选择第一个文件中的视频流进行输出
- 选择要输出的混合音频流
- 输出文件名
您可能实际上并不需要这些-map
线,但我更喜欢使用它们。