我每天都会听一个时长约 4 小时的播客。我认为如果我能想出某种方法来自动生成播客的文字记录,那将是一个很酷的项目。有没有软件可以“收听” mp3 并创建他们所说的文本?
我不太在意区分谁在说话,因为我觉得这要求太高了。有 4 个主要人物在说话,其他人说话不多。
答案1
我相当确定龙可以让你做到这一点。不过,你可能会遇到准确性问题。
答案2
脚步:
- 下载快递抄写员免费的转录播放器并安装。
- 安装应用程序后,您将发现已加载示例听写文件。这将使您有机会尝试各种控件和选项,以设置适合您需求的应用程序。
- 在主界面单击“设置”按钮。
- Express Scribe 允许您更改或设置相当多的参数,包括倒带和快进速度、系统范围热键(无需使用鼠标控制应用程序)、设置脚踏板控制(如果有)、从 LAN 文件夹或 FTP 服务器自动加载文件、允许的文件类型选择(支持超过 20 种)以及设置语音识别引擎。
- 设置好选项后,您现在可以加载第一个音频文件。根据您从哪里接收文件,您可以单击“加载”(将打开一个对话框,允许您在 PC 上浏览文件)、“立即加载”(如果您已设置 LAN 或 FTP 连接)或“Dock”(如果您有数字或盒式录音机)。
- 在主界面窗口中选择音频文件,然后单击“播放”按钮开始播放。如果需要,可以使用最右下角的速度控件减慢或加快音频播放速度。在此控件上方,您还可以调整播放音量。
- 如果您希望 Express Scibe 浮动在文字处理应用程序上方,您可以从主界面工具栏中选择 Scribe Mini。顾名思义,此选项提供该应用程序的微型版本。
- 完成音频文件的转录后,您可以将其标记为“完成”(从列表中删除文件)或“发送”(返回并通过电子邮件将 trext 附件发送给原始发件人,并从列表中删除音频文件)。
尖端
- 花一些时间探索该应用程序的所有选项。
- 如果您收到质量较差的音频文件,您可以从文件菜单中选择特殊音频处理来尝试清理它。
- 当 Express Scribe 收到音频文件时,它会存储在 C:\Documents and Settings\username\Application Data\NCH Swift Sound\scribe\Current
- 如果您已将音频文件标记为“完成”但想要恢复它,您可以从文件菜单中恢复旧文件。
答案3
您可以尝试一件事(虽然不是每天都尝试),那就是将音频作为视频上传到 Youtube,然后让 YouTube 转录视频,为您提供英文字幕...不过,YouTube 可能需要长达 24 小时才能完成此操作...字幕文件甚至可以下载,您可以自己编辑它们,因此您可以将文本复制并粘贴到您想要的任何位置...
答案4
尝试过挥手至文字? 仅适用于 Windows,并提供有限的免费试用。
这些文件中有多少个声音?所有文件都包含一个(可训练)声音的语音吗?音频质量如何?如果这些问题的答案不是:“只有我”、“是”和“CD 质量”,@Snark 是对的,您需要手动完成此操作。获取一个好的语音识别程序,花一些时间训练它,并在尝试说出他们所说的内容时播放您的文件。
预计转录的成功率约为 90% - 95%,这听起来很棒,直到您意识到这意味着每 20 个单词中就有 1 个或 2 个是错误的。
其他可能影响准确性的因素:
- 你的演讲中有很多缩略词
- 不完整的句子 - 语音转文本往往在从完整句子中获取上下文线索的情况下表现更好。