像这样提取硬编码字幕可行吗?

像这样提取硬编码字幕可行吗?

我有一个带有硬编码字幕的 mp4,我想制作一个 SRT 文件。

我尝试使用视频 OCR 软件 AviSub。它的时间准确,但文字本身非常不准确,所以我得到了一个如下所示的 SRT 文件:

1
00:01:22,277 --> 00:01:27,271
innacurate text
innacurate text
2
00:01:38,501 --> 00:01:41,668
innacurate text

现在我已经掌握了时间,我想:

  1. 使用 ffmpeg 从每个时间中提取一帧(我不知道如何做到这一点)。

  2. 使用像 Readiris 这样的精确 OCR 软件对所有这些帧进行批量 OCR(每个帧放入一个单独的 txt 文件)。

  3. 使用 Python 脚本将旧 SRT 文件中的字幕替换为每个新创建的文本文件中的正确字幕。

谢谢

答案1

您可以使用此命令提取帧。

ffmpeg -i infile.mp4 -vframes 1 -ss 00:01:06 outfile.png -vframes 1 -ss 00:10:30 outfile2.png ...

相关内容