ffprobe 字幕流的 OCR

Question 1

基于图像的字幕是一种混合媒体类型，它们包含视频数据，但被指定为字幕。几乎所有 ffmpeg 代码都要求实际流数据属于它们所指示的类型。因此，ffmpeg（并且只有 ffmpeg）有定制的例程来提取此类字幕。

使用

ffmpeg -f lavfi -i color=black:s=hd720 -i pgs.mkv -filter_complex "[0][1:s:0]overlay=format=yuv444:shortest=1,ocr,metadata=print:key=lavfi.ocr.text:file=subs.txt" -an -f null -

Answer

基于图像的字幕是一种混合媒体类型，它们包含视频数据，但被指定为字幕。几乎所有 ffmpeg 代码都要求实际流数据属于它们所指示的类型。因此，ffmpeg（并且只有 ffmpeg）有定制的例程来提取此类字幕。

使用

ffmpeg -f lavfi -i color=black:s=hd720 -i pgs.mkv -filter_complex "[0][1:s:0]overlay=format=yuv444:shortest=1,ocr,metadata=print:key=lavfi.ocr.text:file=subs.txt" -an -f null -

Question 2

是的，有新方法。

如果您愿意，可以尝试 ffmpeg 即将推出的新功能，该功能提供了在过滤器图中处理字幕的功能。目前可在此处获得：

https://github.com/ffstaging/FFmpeg/pull/18

它还包括一个新的 graphicsub2text 过滤器，用于字幕 OCR，包括文本大小、样式和位置、颜色、轮廓和对齐方式。

Answer

是的，有新方法。

如果您愿意，可以尝试 ffmpeg 即将推出的新功能，该功能提供了在过滤器图中处理字幕的功能。目前可在此处获得：

https://github.com/ffstaging/FFmpeg/pull/18

它还包括一个新的 graphicsub2text 过滤器，用于字幕 OCR，包括文本大小、样式和位置、颜色、轮廓和对齐方式。

ffprobe 字幕流的 OCR

答案1

答案2

相关内容