使用 ffmpeg 将视频精确地切割成许多较小的视频

使用 ffmpeg 将视频精确地切割成许多较小的视频

我的视频很大,大概 45 分钟。我想进行大量剪辑(每 20 分钟约 500 次),而且剪辑必须非常准确。因此,使用我找到的帧完美解决方案很烦人 - 它们非常慢。

我为什么要把视频剪辑成那么多视频?我有一个程序可以识别哪里是静音。我想加快视频速度,在静音和有人说话时以不同的速度播放。所以我找出视频中哪些部分是静音/大声的,把它剪辑成那些部分,加快速度,然后把它们重新连接在一起。

现在,经过几次迭代后,我正在使用这个:

ffmpeg -i [input_video] -ss [seconds_to_start_cut] -frames:v [number_of_frames] -f [input_video_extension] [output_name]

在我的程序中,我将视频的静音/响亮部分定义为开始帧和结束帧,并通过从接收的 FPS 计算开始剪切的秒数ffprobe

使用时,剪辑非常精确,但仍有一些工作要做(音频在剪辑过渡时有一点点重复) - 也许 FPS 在整个视频中会略有不同?

但问题是,这种方法极其慢。据我了解,ffmpeg 的工作原理是,每次调用它时,它都会从开始开始计算秒数,不必要地重复之前完成的工作。对于 16 秒长的视频来说,这真的很糟糕,更不用说超过一小时的视频了。

有没有一种合理快速的方法可以精确地执行大量剪辑?这些剪辑不重叠,因此从技术上讲我需要将视频分割成许多较短的视频。如果无法使用 ffmpeg 做到这一点,您能推荐我使用其他工具吗?谢谢。

编辑: 感谢@slhck 提供的链接,我使用了复合滤波器来做到这一点。它在质量方面具有最佳效果,但是处理它需要大约两倍的视频长度(0.428x)。例如对于片段[0-0.25, 2][0.25-0.75,1][0.75-0.1,2][time_from]-[time_to], [speed]),我使用此过滤器:

[0:v]trim=0:0.25,setpts=0.5*(PTS_STARTPTS)[v1];
[0:a]atrim=0:0.25,asetpts=PTS-STARTPTS,atempo=2[a1];
[0:v]trim=0.25:0.75,setpts=1*(PTS_STARTPTS)[v2];
[0:a]atrim=0.25:0.75,asetpts=PTS-STARTPTS,atempo=1[a3];
[0:v]trim=0.75:1,setpts=0.5*(PTS_STARTPTS)[v3];
[0:a]atrim=0.75:1,asetpts=PTS-STARTPTS,atempo=2[a3];
[v1][a1][v2][a2][v3][a3]concat=n=3:v=1:a=1

它由数百上千个片段组成,看上去有些滑稽,但实际上效果非常好!

我目前像这样运行 ffmpeg:

ffmpeg -i madoka.mp4 -filter_complex "[filter]" -f mp4 -movflags frag_keyframe+empty_moov output.mp4

日志:

ffmpeg version n4.2 Copyright (c) 2000-2019 the FFmpeg developers
  built with gcc 9.1.0 (GCC)
  configuration: --prefix=/usr --disable-debug --disable-static --disable-stripping --enable-fontconfig --enable-gmp --enable-gnutls --enable-gpl --enable-ladspa --enable-libaom --enable-libass --enable-libbluray --enable-libdav1d --enable-libdrm --enable-libfreetype --enable-libfribidi --enable-libgsm --enable-libiec61883 --enable-libjack --enable-libmodplug --enable-libmp3lame --enable-libopencore_amrnb --enable-libopencore_amrwb --enable-libopenjpeg --enable-libopus --enable-libpulse --enable-libsoxr --enable-libspeex --enable-libssh --enable-libtheora --enable-libv4l2 --enable-libvidstab --enable-libvorbis --enable-libvpx --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxcb --enable-libxml2 --enable-libxvid --enable-nvdec --enable-nvenc --enable-omx --enable-shared --enable-version3
  libavutil      56. 31.100 / 56. 31.100
  libavcodec     58. 54.100 / 58. 54.100
  libavformat    58. 29.100 / 58. 29.100
  libavdevice    58.  8.100 / 58.  8.100
  libavfilter     7. 57.100 /  7. 57.100
  libswscale      5.  5.100 /  5.  5.100
  libswresample   3.  5.100 /  3.  5.100
  libpostproc    55.  5.100 / 55.  5.100
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'madoka.mp4':
  Metadata:
    major_brand     : mp42
    minor_version   : 0
    compatible_brands: isommp42
    creation_time   : 2016-12-17T08:09:58.000000Z
  Duration: 00:24:09.99, start: 0.000000, bitrate: 1676 kb/s
    Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p(tv, bt709), 1280x720 [SAR 1:1 DAR 16:9], 1482 kb/s, 23.98 fps, 23.98 tbr, 24k tbn, 47.95 tbc (default)
    Metadata:
      handler_name    : VideoHandler
    Stream #0:1(und): Audio: aac (LC) (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 192 kb/s (default)
    Metadata:
      creation_time   : 2016-12-17T08:10:39.000000Z
      handler_name    : IsoMedia File Produced by Google, 5-11-2011
Stream mapping:
  Stream #0:0 (h264) -> trim
###### (523 more lines like this) #####
  Stream #0:1 (aac) -> atrim
###### (523 more lines like this) #####
  concat:out:v0 -> Stream #0:0 (libx264)
  concat:out:a0 -> Stream #0:1 (aac)
Press [q] to stop, [?] for help
[libx264 @ 0x5604a9dc2600] using SAR=1/1
[libx264 @ 0x5604a9dc2600] using cpu capabilities: MMX2 SSE2Fast SSSE3 SSE4.2 AVX FMA3 BMI2 AVX2
[libx264 @ 0x5604a9dc2600] profile High, level 3.1, 4:2:0, 8-bit
[libx264 @ 0x5604a9dc2600] 264 - core 157 r2945 72db437 - H.264/MPEG-4 AVC codec - Copyleft 2003-2018 - http://www.videolan.org/x264.html - options: cabac=1 ref=3 deblock=1:0:0 analyse=0x3:0x113 me=hex subme=7 psy=1 psy_rd=1.00:0.00 mixed_ref=1 me_range=16 chroma_me=1 trellis=1 8x8dct=1 cqm=0 deadzone=21,11 fast_pskip=1 chroma_qp_offset=-2 threads=12 lookahead_threads=2 sliced_threads=0 nr=0 decimate=1 interlaced=0 bluray_compat=0 constrained_intra=0 bframes=3 b_pyramid=2 b_adapt=1 b_bias=0 direct=1 weightb=1 open_gop=0 weightp=2 keyint=250 keyint_min=23 scenecut=40 intra_refresh=0 rc_lookahead=40 rc=crf mbtree=1 crf=23.0 qcomp=0.60 qpmin=0 qpmax=69 qpstep=4 ip_ratio=1.40 aq=1:1.00
Output #0, mp4, to 'madoka.new.mp4':
  Metadata:
    major_brand     : mp42
    minor_version   : 0
    compatible_brands: isommp42
    encoder         : Lavf58.29.100
    Stream #0:0: Video: h264 (libx264) (avc1 / 0x31637661), yuv420p(progressive), 1280x720 [SAR 1:1 DAR 16:9], q=-1--1, 23.98 fps, 24k tbn, 23.98 tbc (default)
    Metadata:
      encoder         : Lavc58.54.100 libx264
    Side data:
      cpb: bitrate max/min/avg: 0/0/0 buffer size: 0 vbv_delay: -1
    Stream #0:1: Audio: aac (LC) (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 128 kb/s (default)
    Metadata:
      encoder         : Lavc58.54.100 aac
frame=    3 fps=0.0 q=0.0 size=       0kB time=00:00:00.00 bitrate=N/A speed=   0x    
frame=    5 fps=4.9 q=0.0 size=       0kB time=00:00:00.02 bitrate=  16.5kbits/s dup=0 drop=9 speed=0.0226x      
(...)

答案1

首先,使用 剪切视频ffmpeg -i [input_video] -ss [seconds_to_start_cut]非常慢。相反,您可以将选项放在-ss之前-i,这意味着 ffmpeg 将首先查找剪切点,然后才开始编码。这仍然是准确的。

也就是说,一个更好的解决方案是使用复杂的过滤图。可以参见以下示例这里。过滤器允许您将视频和音频修剪成片段,并对这些片段应用加速/减速过滤器。

正如您所展示的,这种复杂的过滤链的一个实例是:

[0:v]trim=0:0.25,setpts=0.5*(PTS_STARTPTS)[v1];
[0:a]atrim=0:0.25,asetpts=PTS-STARTPTS,atempo=2[a1];
[0:v]trim=0.25:0.75,setpts=1*(PTS_STARTPTS)[v2];
[0:a]atrim=0.25:0.75,asetpts=PTS-STARTPTS,atempo=1[a3];
[0:v]trim=0.75:1,setpts=0.5*(PTS_STARTPTS)[v3];
[0:a]atrim=0.75:1,asetpts=PTS-STARTPTS,atempo=2[a3];
[v1][a1][v2][a2][v3][a3]concat=n=3:v=1:a=1

这会使第一段和第三段的速度提高 2 倍,并将所有内容连接起来。

为了使编码尽可能快,您可以使用-c:v libx264 -preset faster(甚至ultrafast代替faster),请参阅H.264 编码指南。质量(以及最终文件大小)由CRF参数

相关内容