删除具有不同名称、大小和哈希值的重复 mp3

删除具有不同名称、大小和哈希值的重复 mp3

我有一个庞大的音乐库(都是 mp3),但我的一些音乐几乎是相同的,但是:

  1. 也许多一两秒
  2. 与另一首歌大约 97% 相同
  3. 或者其他比特率。

有没有办法找到这些重复项?如前所述,它们没有相同的大小、名称或 SHA1 哈希值。

答案1

使用 MusicBrainz 的皮卡德。它扫描音乐以生成“指纹”,然后将其与在线数据库进行比较以识别它(提取所有信息,如艺术家、专辑等)。

识别歌曲后,它可以将它们组织到自定义目录和名称结构中,您可以使用它来查找重复项。

与linux完全兼容。

答案2

有一个开源声学指纹识别系统,称为回声打印,你可能想检查我想要对一个大集合进行重复数据删除。我以前没有使用过它(只是偶然发现它),但是能够在本地执行此操作听起来很棒。

答案3

我建议使用beets它的duplicates插件;就功能而言beets类似于picard(它可以从 musicbrainz 数据库查找 ID3 信息并根据该信息组织文件),但其某些插件超出了 picard 的能力。

就我个人而言,我将它们一起使用——picard 用于清理 ID3 标签,beets 用于组织文件并清理重复项。

相关内容