我有一个用例,我会截取几个 MPEG-4 文件,然后修剪它们并将它们连接成一个文件。我还有第二个用例,其中一个文件被修剪并裁剪/缩放,这些文件必须重新编码。
第二个用例的问题是我最终得到了两种不同文件布局的混合:
仅修剪:
Format : MPEG-4
Format : AVC
Format/Info : Advanced Video Codec
Format profile : [email protected]
Format settings, CABAC : Yes
Format settings, ReFrames : 4 frames
Codec ID : avc1
Codec ID/Info : Advanced Video Coding
Duration : 28s 17ms
Bit rate : 3 362 Kbps
Width : 1 280 pixels
Height : 720 pixels
Display aspect ratio : 16:9
Frame rate mode : Variable
Frame rate : 60.000 fps
Minimum frame rate : 58.824 fps
Maximum frame rate : 62.500 fps
Color space : YUV
Chroma subsampling : 4:2:0
Bit depth : 8 bits
Scan type : Progressive
Bits/(Pixel*Frame) : 0.061
Stream size : 11.2 MiB (95%)
Color primaries : BT.709
Transfer characteristics : sYCC
Matrix coefficients : BT.709
修剪 + 裁剪/缩放(重新编码)
Format : MPEG-4
Format : AVC
Format/Info : Advanced Video Codec
Format profile : High 4:4:4 [email protected]
Format settings, CABAC : No
Format settings, ReFrames : 1 frame
Codec ID : avc1
Codec ID/Info : Advanced Video Coding
Duration : 29s 0ms
Bit rate : 24.8 Mbps
Width : 1 280 pixels
Height : 720 pixels
Display aspect ratio : 16:9
Frame rate mode : Constant
Frame rate : 60.000 fps
Color space : YUV
Chroma subsampling : 4:2:0
Bit depth : 8 bits
Scan type : Progressive
Bits/(Pixel*Frame) : 0.448
Stream size : 85.7 MiB (99%)
Writing library : x264 core 144 r96 40bb568
Encoding settings : cabac=0 / ref=1 / deblock=0:0:0 / analyse=0:0 / me=dia / subme=0 / psy=0 / mixed_ref=0 / me_range=16 / chroma_me=1 / trellis=0 / 8x8dct=0 / cqm=0 / deadzone=21,11 / fast_pskip=0 / chroma_qp_offset=0 / threads=3 / lookahead_threads=1 / sliced_threads=0 / nr=0 / decimate=1 / interlaced=0 / bluray_compat=0 / constrained_intra=0 / bframes=0 / weightp=0 / keyint=250 / keyint_min=25 / scenecut=0 / intra_refresh=0 / rc=cqp / mbtree=0 / qp=0
缩放/裁剪命令:
ffmpeg -i -ss 05 test.mp4 -c:a copy -vf "crop=w=(in_w/1000)*%d:h=(in_h/566)*%d:x=(in_w/1000)*%d:y=(in_h/566)*%d,scale=in_w:in_h" out-scale-crop.mp4
根据 LordNeckbeard 的要求,已添加 FFMPEG 的输出
ffmpeg version N-43527-gb23a866- http://johnvansickle.com/ffmpeg/ Copyright (c) 2000-2015 the FFmpeg developers
built on Jan 13 2015 01:29:05 with gcc 4.9.2 (Debian 4.9.2-10)
configuration: --enable-gpl --enable-version3 --disable-shared --disable-debug --enable-runtime-cpudetect --enable-libmp3lame --enable-libx264 --enable-libx265 --enable-libwebp --enable-libspeex --enable-libvorbis --enable-libvpx --enable-libfreetype --enable-fontconfig --enable-libxvid --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-libtheora --enable-libvo-aacenc --enable-libvo-amrwbenc --enable-gray --enable-libopenjpeg --enable-libopus --disable-ffserver --enable-libass --enable-gnutls --cc=gcc
libavutil 54. 16.100 / 54. 16.100
libavcodec 56. 20.100 / 56. 20.100
libavformat 56. 18.101 / 56. 18.101
libavdevice 56. 4.100 / 56. 4.100
libavfilter 5. 7.100 / 5. 7.100
libswscale 3. 1.101 / 3. 1.101
libswresample 1. 1.100 / 1. 1.100
libpostproc 53. 3.100 / 53. 3.100
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from '/home/rohan/render_cache/v4033205_745.mp4':
Metadata:
major_brand : isom
minor_version : 512
compatible_brands: isomiso2avc1mp41
encoder : Lavf56.18.101
Duration: 00:00:35.77, start: 0.000000, bitrate: 2143 kb/s
Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 1920x1080, 2001 kb/s, 30 fps, 30 tbr, 90k tbn, 60 tbc (default)
Metadata:
handler_name : VideoHandler
Stream #0:1(und): Audio: aac (LC) (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 131 kb/s (default)
Metadata:
handler_name : SoundHandler
[libx264 @ 0x360bd20] using cpu capabilities: MMX2 SSE Cache64
[libx264 @ 0x360bd20] profile High 4:4:4 Predictive, level 3.0, 4:2:0 8-bit
[libx264 @ 0x360bd20] 264 - core 144 r96 40bb568 - H.264/MPEG-4 AVC codec - Copyleft 2003-2014 - http://www.videolan.org/x264.html - options: cabac=0 ref=1 deblock=0:0:0 analyse=0:0 me=dia subme=0 psy=0 mixed_ref=0 me_range=16 chroma_me=1 trellis=0 8x8dct=0 cqm=0 deadzone=21,11 fast_pskip=0 chroma_qp_offset=0 threads=3 lookahead_threads=1 sliced_threads=0 nr=0 decimate=1 interlaced=0 bluray_compat=0 constrained_intra=0 bframes=0 weightp=0 keyint=250 keyint_min=25 scenecut=0 intra_refresh=0 rc=cqp mbtree=0 qp=0
Output #0, mp4, to '/home/rohan/render_cache/v4033205_745_1_cut.mp4':
Metadata:
major_brand : isom
minor_version : 512
compatible_brands: isomiso2avc1mp41
encoder : Lavf56.18.101
Stream #0:0(und): Video: h264 (libx264) ([33][0][0][0] / 0x0021), yuv420p, 690x384, q=-1--1, 30 fps, 15360 tbn, 30 tbc (default)
Metadata:
handler_name : VideoHandler
encoder : Lavc56.20.100 libx264
Stream #0:1(und): Audio: aac ([64][0][0][0] / 0x0040), 44100 Hz, stereo, 131 kb/s (default)
Metadata:
handler_name : SoundHandler
Stream mapping:
Stream #0:0 -> #0:0 (h264 (native) -> h264 (libx264))
Stream #0:1 -> #0:1 (copy)
Press [q] to stop, [?] for help
frame= 15 fps=0.0 q=0.0 size= 633kB time=00:00:00.55 bitrate=9409.0kbits/sframe= 65 fps= 65 q=0.0 size= 2986kB time=00:00:02.22 bitrate=11002.2kbits/frame= 117 fps= 77 q=0.0 size= 5507kB time=00:00:03.96 bitrate=11380.3kbits/frame= 182 fps= 91 q=0.0 size= 7832kB time=00:00:06.12 bitrate=10476.3kbits/frame= 244 fps= 97 q=0.0 size= 10248kB time=00:00:08.19 bitrate=10250.0kbits/frame= 290 fps= 96 q=0.0 size= 12275kB time=00:00:09.72 bitrate=10342.1kbits/frame= 337 fps= 96 q=0.0 size= 14408kB time=00:00:11.27 bitrate=10464.6kbits/frame= 401 fps= 99 q=0.0 size= 17318kB time=00:00:13.41 bitrate=10575.5kbits/frame= 458 fps=101 q=0.0 size= 20332kB time=00:00:15.31 bitrate=10872.8kbits/frame= 477 fps= 90 q=0.0 size= 21308kB time=00:00:15.94 bitrate=10946.6kbits/frame= 541 fps= 93 q=0.0 size= 24973kB time=00:00:18.08 bitrate=11314.0kbits/frame= 601 fps= 95 q=0.0 size= 28271kB time=00:00:20.07 bitrate=11534.2kbits/frame= 654 fps= 96 q=0.0 size= 31201kB time=00:00:21.84 bitrate=11701.2kbits/frame= 714 fps= 97 q=0.0 size= 34484kB time=00:00:23.86 bitrate=11837.8kbits/frame= 769 fps= 98 q=0.0 size= 37860kB time=00:00:25.69 bitrate=12069.0kbits/frame= 814 fps= 97 q=0.0 size= 40593kB time=00:00:27.18 bitrate=12232.8kbits/frame= 840 fps= 97 q=-1.0 Lsize= 42204kB time=00:00:28.02 bitrate=12338.7kbits/s dup=1 drop=0
video:41726kB audio:453kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.058509%
[libx264 @ 0x360bd20] frame I:4 Avg QP: 0.00 size:132759
[libx264 @ 0x360bd20] frame P:836 Avg QP: 0.00 size: 50474
[libx264 @ 0x360bd20] mb I I16..4: 100.0% 0.0% 0.0%
[libx264 @ 0x360bd20] mb P I16..4: 15.1% 0.0% 0.0% P16..4: 40.7% 0.0% 0.0% 0.0% 0.0% skip:44.2%
[libx264 @ 0x360bd20] coded y,uvDC,uvAC intra: 99.5% 98.9% 98.7% inter: 36.3% 39.9% 39.5%
[libx264 @ 0x360bd20] i16 v,h,dc,p: 56% 44% 0% 0%
[libx264 @ 0x360bd20] i8c dc,h,v,p: 0% 44% 55% 0%
[libx264 @ 0x360bd20] kb/s:12207.68
修剪命令:
ffmpeg -i -ss 05 test.mp4 -codec copy trimmed.mp4
ffmpeg version N-43527-gb23a866- http://johnvansickle.com/ffmpeg/ Copyright (c) 2000-2015 the FFmpeg developers
built on Jan 13 2015 01:29:05 with gcc 4.9.2 (Debian 4.9.2-10)
configuration: --enable-gpl --enable-version3 --disable-shared --disable-debug --enable-runtime-cpudetect --enable-libmp3lame --enable-libx264 --enable-libx265 --enable-libwebp --enable-libspeex --enable-libvorbis --enable-libvpx --enable-libfreetype --enable-fontconfig --enable-libxvid --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-libtheora --enable-libvo-aacenc --enable-libvo-amrwbenc --enable-gray --enable-libopenjpeg --enable-libopus --disable-ffserver --enable-libass --enable-gnutls --cc=gcc
libavutil 54. 16.100 / 54. 16.100
libavcodec 56. 20.100 / 56. 20.100
libavformat 56. 18.101 / 56. 18.101
libavdevice 56. 4.100 / 56. 4.100
libavfilter 5. 7.100 / 5. 7.100
libswscale 3. 1.101 / 3. 1.101
libswresample 1. 1.100 / 1. 1.100
libpostproc 53. 3.100 / 53. 3.100
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from '/home/rohan/render_cache/v4033205_6295.mp4':
Metadata:
major_brand : isom
minor_version : 512
compatible_brands: isomiso2avc1mp41
encoder : Lavf56.18.101
Duration: 00:00:36.02, start: 0.000000, bitrate: 2142 kb/s
Stream #0:0(und): Video: h264 (High) (avc1 / 0x31637661), yuv420p, 1920x1080, 2001 kb/s, 30 fps, 30 tbr, 90k tbn, 60 tbc (default)
Metadata:
handler_name : VideoHandler
Stream #0:1(und): Audio: aac (LC) (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 131 kb/s (default)
Metadata:
handler_name : SoundHandler
Output #0, mp4, to '/home/rohan/render_cache/v4033205_6295_0_cut.mp4':
Metadata:
major_brand : isom
minor_version : 512
compatible_brands: isomiso2avc1mp41
encoder : Lavf56.18.101
Stream #0:0(und): Video: h264 ([33][0][0][0] / 0x0021), yuv420p, 1920x1080, q=2-31, 2001 kb/s, 30 fps, 30 tbr, 90k tbn, 90k tbc (default)
Metadata:
handler_name : VideoHandler
Stream #0:1(und): Audio: aac ([64][0][0][0] / 0x0040), 44100 Hz, stereo, 131 kb/s (default)
Metadata:
handler_name : SoundHandler
Stream mapping:
Stream #0:0 -> #0:0 (copy)
Stream #0:1 -> #0:1 (copy)
Press [q] to stop, [?] for help
frame= 841 fps=0.0 q=-1.0 Lsize= 7498kB time=00:00:28.02 bitrate=2192.1kbits/s
当我播放这些合并为一个文件的修剪文件时,一切似乎都可以在 MPC-HC 和 Youtube 上正确播放,但是当我添加缩放/裁剪的文件并将它们与未缩放/裁剪的文件合并在一起时,两个播放器在切换到下一个片段时都会冻结。
我怀疑可变/恒定帧速率切换是罪魁祸首。
简单的解决方案就是将所有内容重新编码为相同的恒定帧速率,但我希望我不需要这样做(编解码器:复制速度快并且保持质量)并且我接收这些文件的源可能具有不同的帧速率等。
我最好使用与输入文件完全相同的设置来执行裁剪/缩放重新编码,这样在连接时就不会遇到输出文件不匹配的情况。这可能吗?
编辑#2,@occvtech
我确实正在使用 concat 协议,使用 merge_list.txt ,如下所示:
./ffmpeg -f concat -i merge_list.txt -codec copy 输出.mp4
其输出如下:
ffmpeg version 2.6.2- http://johnvansickle.com/ffmpeg/ Copyright (c) 2000-2015 the FFmpeg developers
built with gcc 4.9.2 (Debian 4.9.2-10)
configuration: --enable-gpl --enable-version3 --disable-shared --disable-debug --enable-runtime-cpudetect --enable-libmp3lame --enable-libx264 --enable-libx265 --enable-libwebp --enable-libspeex --enable-libvorbis --enable-libvpx --enable-libfreetype --enable-fontconfig --enable-libxvid --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-libtheora --enable-libvo-aacenc --enable-libvo-amrwbenc --enable-gray --enable-libopenjpeg --enable-libopus --enable-libass --enable-gnutls --enable-libvidstab --enable-libsoxr --cc=gcc-4.9
libavutil 54. 20.100 / 54. 20.100
libavcodec 56. 26.100 / 56. 26.100
libavformat 56. 25.101 / 56. 25.101
libavdevice 56. 4.100 / 56. 4.100
libavfilter 5. 11.102 / 5. 11.102
libswscale 3. 1.101 / 3. 1.101
libswresample 1. 1.100 / 1. 1.100
libpostproc 53. 3.100 / 53. 3.100
Input #0, concat, from '/home/rohan/render_cache/merge_list.txt':
Duration: N/A, start: 0.000000, bitrate: 2208 kb/s
Stream #0:0: Video: h264 (High) (avc1 / 0x31637661), yuv420p, 1920x1080, 2076 kb/s, 30 fps, 30 tbr, 90k tbn, 60 tbc
Stream #0:1: Audio: aac (LC) (mp4a / 0x6134706D), 44100 Hz, stereo, fltp, 131 kb/s
Output #0, mp4, to '/home/rohan/render_cache/sivhd_final.mp4':
Metadata:
encoder : Lavf56.25.101
Stream #0:0: Video: h264 ([33][0][0][0] / 0x0021), yuv420p, 1920x1080, q=2-31, 2076 kb/s, 30 fps, 30 tbr, 15360 tbn, 60 tbc
Stream #0:1: Audio: aac ([64][0][0][0] / 0x0040), 44100 Hz, stereo, 131 kb/s
Stream mapping:
Stream #0:0 -> #0:0 (copy)
Stream #0:1 -> #0:1 (copy)
Press [q] to stop, [?] for help
[concat @ 0x3204d60] DTS 92955 < 541117 out of order
[mp4 @ 0x322eb80] Non-monotonous DTS in output stream 0:0; previous: 92351, current: 15864; changing to 92352. This may result in incorrect timestamps in the output file. x 2000
frame= 421 fps=0.0 q=-1.0 Lsize= 13507kB time=00:00:14.07 bitrate=7862.8kbits/s
video:13268kB audio:226kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.096110%
非单调 DTS 警告打印了很多次(240 次),但 DTS 指的是音频,并且输出文件中的音频在裁剪/修剪部分之前听起来都很好。
另外,我已经尝试了您的建议,在修剪/裁剪 ffmpeg 步骤和连接步骤中更改帧速率(以及与不同 vsync 参数的组合),但它们似乎只有在我重新编码时才有效,而不是复制编解码器。
--
在我开始编写第二个编辑后,我已经尝试了每个 vsync、filter:v fps、framerate、-r 参数几个小时,到目前为止唯一真正有效的解决方案是使用 60 fps 重新编码所有内容(即使它们没有被修剪/裁剪)并将其连接起来。使用 -preset ultrafast 和 -qp 0 感觉足够快,文件大小相当大,但我无论如何都不会保留这些文件。
因此,当其中至少有一个裁剪/缩放的文件时,编解码器复制似乎是行不通的。
如果其他人确实有关于此问题的解决方案而不需要重新编码所有内容,我会很乐意接受,否则我会将赏金授予@occvtech。
答案1
我在使用 concat 过滤器时也遇到了类似的问题,我认为这是由于输入所使用的时间基准不同造成的。
我用 concat 克服了它协议方法。
我认为它显示了您的修剪输出的可变帧速率,因为在 1/90000 基本时间内,60Hz 视频将每 1500 帧出现一帧,但 concat 过滤器可能将两个视频合并在一起,最后一帧和第一帧之间有 1530 周期间隙(58.824 fps),其他地方有 1440 周期间隙(62.500 fps)。此外,无论出于何种原因,ffmpeg 决定将输出时间基准设置为 1/15360。
裁剪后,它会重新评估整个输出运行长度的基准时间,这就是您获得恒定帧速率的原因。请注意,您的第一个视频显示 tbn 为 15360,而第二个视频显示 90k。
在我的例子中,我注意到使用 concat 过滤器时,即使其他输入视频流的时间基准不同,PTS/DTS 值也会根据第一个输入的时间基准进行设置。第一个视频使用 1/25,第二个视频使用 1/90000,在输出上运行此操作(输出的新时间基准为 1/12800):
ffprobe -hide_banner -show_frames -i output.mp4 2>&1 | grep -A 21 video | grep ts=
在视频之间的转换点会发生以下情况:
pkt_pts=253952
pkt_dts=253952
pkt_pts=254464
pkt_dts=254464
pkt_pts=254976
pkt_dts=254976
pkt_pts=255488
pkt_dts=255488
pkt_pts=256000
pkt_dts=923443200
pkt_pts=925286400
pkt_dts=925286400
pkt_pts=923443200
pkt_dts=1045094400
pkt_pts=952934400
pkt_dts=1046937600
pkt_pts=954777600
pkt_dts=1048780800
pkt_pts=956620800
pkt_dts=1050624000
答案2
应用过滤器时无法编解码器复制。
此外,Youtube 的最大帧速率为 60fps,所以如果这是您的最终目标,那么您无论如何都会在转码链中的某个时刻从可变帧速率文件中删除帧。
如果对您的文件类型以及所需的最终格式没有更具体的了解,就很难给出更好的建议。
话虽如此,如果您要将文件上传到 YouTube,我建议您对文件进行转码,并将其设置为静态帧速率。您也可以使用连接过滤器而不是连接协议一步完成所有操作 - 这样您就不需要生成中间文件了。
ffmpeg -i [INPUT1] -i [INPUT2] -filter_complex "[0:v] [0:a] [1:v] [1:a] concat=n=2:v=1:a=1 [v] [a]" -map "[v]" -map "[a]" ... [OUTPUT]
如果质量是你的主要目标,并且在进入 YouTube 之前你不会保留中间文件,那么你可以使用转码为未压缩格式-c:v rawvideo
。文件大小会大得多 - 所以再说一次,在不知道你的最终目标的情况下,我不确定未压缩是否是你的最佳选择