为什么像 Dragon 这样的音频听写软件只能从扬声器侧工作?

为什么像 Dragon 这样的音频听写软件只能从扬声器侧工作?

我不想让我的笔记本电脑或手机只口述/输入我说的话,而是写下电话另一端的呼叫者说的话。为什么 Google 或 Nuance 不启用该功能?这可能吗?要实现该功能需要什么?

答案1

当你说话时,你的声音会通过电脑的麦克风和音频硬件被记录下来。此音频信号可供电脑上的任何应用程序使用。当你通过 Skype 与某人交谈时,语音信号被编码成一堆数据包。你需要对 Skype 的协议进行逆向工程才能解码语音信号。

如果您在手机上以免提模式通话,语音质量可能不够好,无法进行语音识别。此外,语音识别软件需要接受您和对方声音的训练。

我不确定谷歌在这里有什么相关性。

答案2

Dragon NaturallySpeaking(与 Google 不同)需要经过训练才能将语音转录成文字。

当有人在 Google 语音的自动回复器上留言时,Google 会为电话另一端的呼叫者将语音转录为文本。

请注意,通话过程中语音质量通常会发生很大变化,这使得语音识别更加困难。

相关内容