我拥有的

我拥有的

我正在寻找一种能够可靠地给出两个视频彼此之间的“数学距离”的方法。类似于如何编辑距离可用于获取从一个字符串到另一个字符串的距离。是否有一个命令或命令序列可以为我提供这样的功能。我连续想要自动删除跨多个视频编解码器和文件类型的视频重复项。

我拥有的

例如,我有很多视频可能仅在编解码器上有所不同(重复)。文件格式范围从 webm、mp4、flv、mkv 到 avi。将这些视频与 sha256sum 进行比较当然是行不通的,类似于视频中的某些帧,它们会因伪像的轻微变化而变化。我的方法之一包括使用ffmpeg每 x 秒获取每一帧的图片,然后使用compareImageMagic 获取数值距离并用于awk计算图像数量的总值的平均值。这有一些我想摆脱的缺点:

  • 它只适用于图像

  • 我必须手动调整compare指标的阈值,直到技术上低于工件的阈值,以便有足够的信心允许自动删除

  • 我必须手动检查每个视频及其可能的重复项,以了解差异是什么(从开始到结束)

换句话说:

是否有命令、算法或工具可以链接到 shell 脚本中以自动删除视频重复项?或者对我的方法进行改进,跨越多种视频格式,并且哪个不那么主观?我希望这个工具足够抽象(因此而是一个计算数学索引的工具),以匹配未来涉及视频内容的比较任务。我可能不知道,这可能是一个已知问题,知道它的名称可能会帮助我找到工具。

相关内容