我想知道是否有办法通过 OCR 提取硬编码字幕,我应该在提取帧后进行一些图像处理以便以后使用吗tesseract
?
我尝试从视频中提取帧并删除所有非字幕颜色的内容,但tesseract
之后使用时得到了糟糕的结果。
仅使用像这样的解决方法是否可以获得不错的结果,还是我应该训练tesseract
自己?使用随机字体添加到随机电影图片上的随机引号很容易生成训练数据,但需要大量时间来训练它。
我想知道是否有办法通过 OCR 提取硬编码字幕,我应该在提取帧后进行一些图像处理以便以后使用吗tesseract
?
我尝试从视频中提取帧并删除所有非字幕颜色的内容,但tesseract
之后使用时得到了糟糕的结果。
仅使用像这样的解决方法是否可以获得不错的结果,还是我应该训练tesseract
自己?使用随机字体添加到随机电影图片上的随机引号很容易生成训练数据,但需要大量时间来训练它。