我正在寻找一种可以让我输入音频文件(.wav .mp3...)并输出音频文件文本的软件。
有这样的软件吗?我只找到能将(现场)语音转换为文本的软件,却找不到能将音频文件转换为文本的软件。
答案1
我不知道您可以下载什么,但我可以提出一个笨拙的建议。
Google 已经构建了这样一款软件,我知道他们在 YouTube 和 Google Voice 中使用它。
它是不太好,但您可以拨打您的 Google Voice 帐户,让应答服务接听,并在录制语音邮件时播放音频。
您将在电子邮件中收到语音邮件的转录。
我之所以建议这样做只是因为您不必训练 Google 的引擎。
答案2
这并不能具体回答您的问题,但对于您的情况,我会将其作为 Amazon Mechanical Turk 作业进行分发。这样,您可能会获得最佳结果并支付最少的费用。
答案3
eMicrophones 制作了一款名为Windows 语音识别工具包它为 Windows 语音识别增添了许多优点,包括转录 *.WAV 文件的功能(前提是这些文件来自您,即录音就像您说话一样,而不是任意的声音)。功能列表如下:
转录从数字录音机读取 .WAV 文件并将其转录为文本。此功能适用于拥有个人用户资料并像在电脑前一样使用良好的发音和标点符号进行口述的人。此功能不适用于转录会议中的多个声音。
答案4
有一个名为“fanscribe”的软件项目,它可以将录音分解成多个部分,然后分发给感兴趣的人,他们可以转录其中的一部分。
https://github.com/fanscribed/fanscribed/blob/master/README.rst