我有一个庞大的音乐库(都是 mp3),但我的一些音乐几乎是相同的,但是:
- 也许多一两秒
- 与另一首歌大约 97% 相同
- 或者其他比特率。
有没有办法找到这些重复项?如前所述,它们没有相同的大小、名称或 SHA1 哈希值。
答案1
使用 MusicBrainz 的皮卡德。它扫描音乐以生成“指纹”,然后将其与在线数据库进行比较以识别它(提取所有信息,如艺术家、专辑等)。
识别歌曲后,它可以将它们组织到自定义目录和名称结构中,您可以使用它来查找重复项。
与linux完全兼容。
答案2
有一个开源声学指纹识别系统,称为回声打印,你可能想检查我想要对一个大集合进行重复数据删除。我以前没有使用过它(只是偶然发现它),但是能够在本地执行此操作听起来很棒。
答案3
我建议使用beets
它的duplicates
插件;就功能而言beets
类似于picard
(它可以从 musicbrainz 数据库查找 ID3 信息并根据该信息组织文件),但其某些插件超出了 picard 的能力。
就我个人而言,我将它们一起使用——picard 用于清理 ID3 标签,beets 用于组织文件并清理重复项。