转录创建者或语音转文本

转录创建者或语音转文本

我每天都会听一个时长约 4 小时的播客。我认为如果我能想出某种方法来自动生成播客的文字记录,那将是一个很酷的项目。有没有软件可以“收听” mp3 并创建他们所说的文本?

我不太在意区分谁在说话,因为我觉得这要求太高了。有 4 个主要人物在说话,其他人说话不多。

答案1

我相当确定可以让你做到这一点。不过,你可能会遇到准确性问题。

答案2

脚步:

  1. 下载快递抄写员免费的转录播放器并安装。
    1. 安装应用程序后,您将发现已加载示例听写文件。这将使您有机会尝试各种控件和选项,以设置适合您需求的应用程序。
    2. 在主界面单击“设置”按钮。
    3. Express Scribe 允许您更改或设置相当多的参数,包括倒带和快进速度、系统范围热键(无需使用鼠标控制应用程序)、设置脚踏板控制(如果有)、从 LAN 文件夹或 FTP 服务器自动加载文件、允许的文件类型选择(支持超过 20 种)以及设置语音识别引擎。
    4. 设置好选项后,您现在可以加载第一个音频文件。根据您从哪里接收文件,您可以单击“加载”(将打开一个对话框,允许您在 PC 上浏览文件)、“立即加载”(如果您已设置 LAN 或 FTP 连接)或“Dock”(如果您有数字或盒式录音机)。
    5. 在主界面窗口中选择音频文件,然后单击“播放”按钮开始播放。如果需要,可以使用最右下角的速度控件减慢或加快音频播放速度。在此控件上方,您还可以调整播放音量。
    6. 如果您希望 Express Scibe 浮动在文字处理应用程序上方,您可以从主界面工具栏中选择 Scribe Mini。顾名思义,此选项提供该应用程序的微型版本。
    7. 完成音频文件的转录后,您可以将其标记为“完成”(从列表中删除文件)或“发送”(返回并通过电子邮件将 trext 附件发送给原始发件人,并从列表中删除音频文件)。

尖端

  • 花一些时间探索该应用程序的所有选项。
  • 如果您收到质量较差的音频文件,您可以从文件菜单中选择特殊音频处理来尝试清理它。
  • 当 Express Scribe 收到音频文件时,它会存储在 C:\Documents and Settings\username\Application Data\NCH Swift Sound\scribe\Current
  • 如果您已将音频文件标记为“完成”但想要恢复它,您可以从文件菜单中恢复旧文件。

答案3

您可以尝试一件事(虽然不是每天都尝试),那就是将音频作为视频上传到 Youtube,然后让 YouTube 转录视频,为您提供英文字幕...不过,YouTube 可能需要长达 24 小时才能完成此操作...字幕文件甚至可以下载,您可以自己编辑它们,因此您可以将文本复制并粘贴到您想要的任何位置...

答案4

尝试过挥手至文字? 仅适用于 Windows,并提供有限的免费试用。

这些文件中有多少个声音?所有文件都包含一个(可训练)声音的语音吗?音频质量如何?如果这些问题的答案不是:“只有我”、“是”和“CD 质量”,@Snark 是对的,您需要手动完成此操作。获取一个好的语音识别程序,花一些时间训练它,并在尝试说出他们所说的内容时播放您的文件。

预计转录的成功率约为 90% - 95%,这听起来很棒,直到您意识到这意味着每 20 个单词中就有 1 个或 2 个是错误的。

其他可能影响准确性的因素:

  1. 你的演讲中有很多缩略词
  2. 不完整的句子 - 语音转文本往往在从完整句子中获取上下文线索的情况下表现更好。

相关内容