如何使用命令行软件从音乐中提取人声？

Question

如果不进行大量处理，您无法完全提取声音文件中的人声。
问题是，从数学上讲，软件没有足够的信息来分离它。

让我简单解释一下，你可以将立体声文件分解为三个数据。纯左声道的声音 ( L)、纯右声道的声音 ( R) 和纯中声道的声音 ( M)。

如果我们将两个立体声通道命名为X和Y，那么我们只需：

X = R + M/2
Y = L + M/2

我们知道的是X和Y，另外三个是我们想要分离的未知数。

你去除人声的方法的理念是，人声是几乎总是在中间部分。所以你可以计算

X - Y = R - L

由于左右数据完全不同，因此不会产生干扰，听起来也不错。但是，它也会删除所有中间乐器，如果人声不是完全居中，效果就不太好。

您想要的是隔离M，并且给定数据，从数学上讲，通过简单地组合2个通道是不可能的：它是一个具有3个未知数的2方程线性系统，没有足够的数据来求解它，并且提取M意味着要求解它。

你也可以尝试用更复杂的方法提取人声，但会花费你很多时间，而且效果也不太好。分离人声和乐器非常困难，因为它们主要处于相同的频率范围内。

Answer 1