我的视频很大,大概 45 分钟。我想进行大量剪辑(每 20 分钟约 500 次),而且剪辑必须非常准确。因此,使用我找到的帧完美解决方案很烦人 - 它们非常慢。
我为什么要把视频剪辑成那么多视频?我有一个程序可以识别哪里是静音。我想加快视频速度,在静音和有人说话时以不同的速度播放。所以我找出视频中哪些部分是静音/大声的,把它剪辑成那些部分,加快速度,然后把它们重新连接在一起。
现在,经过几次迭代后,我正在使用这个:
ffmpeg -i [input_video] -ss [seconds_to_start_cut] -frames:v [number_of_frames] -f [input_video_extension] [output_name]
在我的程序中,我将视频的静音/响亮部分定义为开始帧和结束帧,并通过从接收的 FPS 计算开始剪切的秒数ffprobe
。
使用时,剪辑非常精确,但仍有一些工作要做(音频在剪辑过渡时有一点点重复) - 也许 FPS 在整个视频中会略有不同?
但问题是,这种方法极其慢。据我了解,ffmpeg 的工作原理是,每次调用它时,它都会从开始开始计算秒数,不必要地重复之前完成的工作。对于 16 秒长的视频来说,这真的很糟糕,更不用说超过一小时的视频了。
有没有一种合理快速的方法可以精确地执行大量剪辑?这些剪辑不重叠,因此从技术上讲我需要将视频分割成许多较短的视频。如果无法使用 ffmpeg 做到这一点,您能推荐我使用其他工具吗?谢谢。
编辑:
感谢@slhck 提供的链接,我使用了复合滤波器来做到这一点。它在质量方面具有最佳效果,但是处理它需要大约两倍的视频长度(0.428x)。例如对于片段[0-0.25, 2][0.25-0.75,1][0.75-0.1,2]
([time_from]-[time_to], [speed]
),我使用此过滤器:
[0:v]trim=0:0.25,setpts=0.5*(PTS_STARTPTS)[v1];
[0:a]atrim=0:0.25,asetpts=PTS-STARTPTS,atempo=2[a1];
[0:v]trim=0.25:0.75,setpts=1*(PTS_STARTPTS)[v2];
[0:a]atrim=0.25:0.75,asetpts=PTS-STARTPTS,atempo=1[a3];
[0:v]trim=0.75:1,setpts=0.5*(PTS_STARTPTS)[v3];
[0:a]atrim=0.75:1,asetpts=PTS-STARTPTS,atempo=2[a3];
[v1][a1][v2][a2][v3][a3]concat=n=3:v=1:a=1
它由数百上千个片段组成,看上去有些滑稽,但实际上效果非常好!
我目前像这样运行 ffmpeg:
ffmpeg -i madoka.mp4 -filter_complex "[filter]" -f mp4 -movflags frag_keyframe+empty_moov output.mp4
日志:
ffmpeg version n4.2 Copyright (c) 2000-2019 the FFmpeg developers
built with gcc 9.1.0 (GCC)
configuration: --prefix=/usr --disable-debug --disable-static --disable-stripping --enable-fontconfig --enable-gmp --enable-gnutls --enable-gpl --enable-ladspa --enable-libaom --enable-libass --enable-libbluray --enable-libdav1d --enable-libdrm --enable-libfreetype --enable-libfribidi --enable-libgsm --enable-libiec61883 --enable-libjack --enable-libmodplug --enable-libmp3lame --enable-libopencore_amrnb --enable-libopencore_amrwb --enable-libopenjpeg --enable-libopus --enable-libpulse --enable-libsoxr --enable-libspeex --enable-libssh --enable-libtheora --enable-libv4l2 --enable-libvidstab --enable-libvorbis --enable-libvpx --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxcb --enable-libxml2 --enable-libxvid --enable-nvdec --enable-nvenc --enable-omx --enable-shared --enable-version3
libavutil 56. 31.100 / 56. 31.100
libavcodec 58. 54.100 / 58. 54.100
libavformat 58. 29.100 / 58. 29.100
libavdevice 58. 8.100 / 58. 8.100
libavfilter 7. 57.100 / 7. 57.100
libswscale 5. 5.100 / 5. 5.100
libswresample 3. 5.100 / 3. 5.100
libpostproc 55. 5.100 / 55. 5.100
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'madoka.mp4':
Metadata:
major_brand : mp42
minor_version : 0
compatible_brands: isommp42
creation_time : 2016-12-17T08:09:58.000000Z
Duration: 00:24:09.99, start: 0.000000, bitrate: 1676 kb/s
Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p(tv, bt709), 1280x720 [SAR 1:1 DAR 16:9], 1482 kb/s, 23.98 fps, 23.98 tbr, 24k tbn, 47.95 tbc (default)
Metadata:
handler_name : VideoHandler
Stream #0:1(und): Audio: aac (LC) (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 192 kb/s (default)
Metadata:
creation_time : 2016-12-17T08:10:39.000000Z
handler_name : IsoMedia File Produced by Google, 5-11-2011
Stream mapping:
Stream #0:0 (h264) -> trim
###### (523 more lines like this) #####
Stream #0:1 (aac) -> atrim
###### (523 more lines like this) #####
concat:out:v0 -> Stream #0:0 (libx264)
concat:out:a0 -> Stream #0:1 (aac)
Press [q] to stop, [?] for help
[libx264 @ 0x5604a9dc2600] using SAR=1/1
[libx264 @ 0x5604a9dc2600] using cpu capabilities: MMX2 SSE2Fast SSSE3 SSE4.2 AVX FMA3 BMI2 AVX2
[libx264 @ 0x5604a9dc2600] profile High, level 3.1, 4:2:0, 8-bit
[libx264 @ 0x5604a9dc2600] 264 - core 157 r2945 72db437 - H.264/MPEG-4 AVC codec - Copyleft 2003-2018 - http://www.videolan.org/x264.html - options: cabac=1 ref=3 deblock=1:0:0 analyse=0x3:0x113 me=hex subme=7 psy=1 psy_rd=1.00:0.00 mixed_ref=1 me_range=16 chroma_me=1 trellis=1 8x8dct=1 cqm=0 deadzone=21,11 fast_pskip=1 chroma_qp_offset=-2 threads=12 lookahead_threads=2 sliced_threads=0 nr=0 decimate=1 interlaced=0 bluray_compat=0 constrained_intra=0 bframes=3 b_pyramid=2 b_adapt=1 b_bias=0 direct=1 weightb=1 open_gop=0 weightp=2 keyint=250 keyint_min=23 scenecut=40 intra_refresh=0 rc_lookahead=40 rc=crf mbtree=1 crf=23.0 qcomp=0.60 qpmin=0 qpmax=69 qpstep=4 ip_ratio=1.40 aq=1:1.00
Output #0, mp4, to 'madoka.new.mp4':
Metadata:
major_brand : mp42
minor_version : 0
compatible_brands: isommp42
encoder : Lavf58.29.100
Stream #0:0: Video: h264 (libx264) (avc1 / 0x31637661), yuv420p(progressive), 1280x720 [SAR 1:1 DAR 16:9], q=-1--1, 23.98 fps, 24k tbn, 23.98 tbc (default)
Metadata:
encoder : Lavc58.54.100 libx264
Side data:
cpb: bitrate max/min/avg: 0/0/0 buffer size: 0 vbv_delay: -1
Stream #0:1: Audio: aac (LC) (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 128 kb/s (default)
Metadata:
encoder : Lavc58.54.100 aac
frame= 3 fps=0.0 q=0.0 size= 0kB time=00:00:00.00 bitrate=N/A speed= 0x
frame= 5 fps=4.9 q=0.0 size= 0kB time=00:00:00.02 bitrate= 16.5kbits/s dup=0 drop=9 speed=0.0226x
(...)
答案1
首先,使用 剪切视频ffmpeg -i [input_video] -ss [seconds_to_start_cut]
非常慢。相反,您可以将选项放在-ss
之前-i
,这意味着 ffmpeg 将首先查找剪切点,然后才开始编码。这仍然是准确的。
也就是说,一个更好的解决方案是使用复杂的过滤图。可以参见以下示例这里。过滤器允许您将视频和音频修剪成片段,并对这些片段应用加速/减速过滤器。
正如您所展示的,这种复杂的过滤链的一个实例是:
[0:v]trim=0:0.25,setpts=0.5*(PTS_STARTPTS)[v1];
[0:a]atrim=0:0.25,asetpts=PTS-STARTPTS,atempo=2[a1];
[0:v]trim=0.25:0.75,setpts=1*(PTS_STARTPTS)[v2];
[0:a]atrim=0.25:0.75,asetpts=PTS-STARTPTS,atempo=1[a3];
[0:v]trim=0.75:1,setpts=0.5*(PTS_STARTPTS)[v3];
[0:a]atrim=0.75:1,asetpts=PTS-STARTPTS,atempo=2[a3];
[v1][a1][v2][a2][v3][a3]concat=n=3:v=1:a=1
这会使第一段和第三段的速度提高 2 倍,并将所有内容连接起来。
为了使编码尽可能快,您可以使用-c:v libx264 -preset faster
(甚至ultrafast
代替faster
),请参阅H.264 编码指南。质量(以及最终文件大小)由CRF参数。