我有一个带有硬编码字幕的 mp4,我想制作一个 SRT 文件。
我尝试使用视频 OCR 软件 AviSub。它的时间准确,但文字本身非常不准确,所以我得到了一个如下所示的 SRT 文件:
1
00:01:22,277 --> 00:01:27,271
innacurate text
innacurate text
2
00:01:38,501 --> 00:01:41,668
innacurate text
现在我已经掌握了时间,我想:
使用 ffmpeg 从每个时间中提取一帧(我不知道如何做到这一点)。
使用像 Readiris 这样的精确 OCR 软件对所有这些帧进行批量 OCR(每个帧放入一个单独的 txt 文件)。
使用 Python 脚本将旧 SRT 文件中的字幕替换为每个新创建的文本文件中的正确字幕。
谢谢
答案1
您可以使用此命令提取帧。
ffmpeg -i infile.mp4 -vframes 1 -ss 00:01:06 outfile.png -vframes 1 -ss 00:10:30 outfile2.png ...