就这个问题而言https://unix.stackexchange.com/questions/3037/is-there-an-easy-way-to-replace-duplicate-files-with-hardlinks有没有软件可以自动解析我的歌曲库并找出真正重复的歌曲,然后删除?以下是一个例子:
我哥哥曾经是混音 CD 的超级粉丝。他会把所有他喜欢的曲目都放在一张 CD 上。然后他会用我的电脑读入它们。所以现在我的硬盘上有 6 份《加州靡情》,它们的总和都有几个字节的差异。我的库中有数百首这样的歌曲。我想将它们精简为具有唯一性。它们并非都具有正确的 ID3 标签,因此找出Untitled(74).mp3
相同的内容californication.mp3
很whowrotethis.mp3
棘手。
我不想将音乐会专辑和录音室专辑的翻录视为相同的(如果我只是进行艺术家/标题匹配,我就会遇到这种情况,这对我来说不起作用)。
我使用 Windows(选择您的平台),并将在今年晚些时候获得一个 OSX 盒子。如果 Linux 能够组织好它,我将运行它。我有未受保护的 AAC 和 mp3 文件。处理 WAV 或 MIDI 可获得加分,将它们转换为 MP3 可获得加分(如果我知道它们匹配,我总是可以使用 Audacity 和 LAME 稍后进行转换,或者如果这样做会使事情更容易,可以提前进行转换)。
有什么建议吗,或者我需要去找程序员或 SO 并建立一个比较这些内容的需求列表并自己编写软件?
答案1
这实际上是一个相当困难的算法问题,但幸运的是它已经被写出来了。MusicBrainz Picard 将通过声音识别歌曲,然后根据庞大的音频指纹数据库为歌曲分配一个名称。
如果它识别出重复歌曲,它会为歌曲赋予与原歌曲相同的名称,并在末尾附加一个数字,因此您可以通过删除任何末尾附加数字的歌曲来轻松删除重复歌曲。我已经有几年没用过 Picard 了,所以可能已经添加了重复删除功能。
MusicBrainz Picardhttp://musicbrainz.org/doc/PicardTagger