在输出中添加时间戳?pocketsphinx
我一直使用 pocketsphinx 成功地从 wav 文件中抓取转录本,我觉得添加时间戳的参数很合理。实际上,帮助文件中有太多参数: Arguments list definition: [NAME] [DEFLT] [DESCR] -adcdev Name of audio device to use for input. -agc none Automatic gain contr...
我一直使用 pocketsphinx 成功地从 wav 文件中抓取转录本,我觉得添加时间戳的参数很合理。实际上,帮助文件中有太多参数: Arguments list definition: [NAME] [DEFLT] [DESCR] -adcdev Name of audio device to use for input. -agc none Automatic gain contr...
我想知道是否有办法可以禁用 Word 转录功能中的脏话过滤器。 我知道 Dictate 有这个功能。但是,据我所知,关闭它似乎对通过“转录”选项提交的音频文件没有影响。 我认为这并不重要,但目前,这是使用 Word EXE 文件中的“转录”选项,而不是在浏览器中尝试。 ...
我已经能够使用 FFmpeg 和 OpenAI Whisper 将音频文件转录为文本。 我想要做的是,不是使用预先录制的文件,而是将 RTMP 馈送至 FFmpeg 以便实时转录。 ...
我买了一个 USB 脚踏开关,它“能用”,但只能用作“输入”按钮。我花了一上午的时间尝试重新映射它,但 Windows 坚持只将其识别为输入,而不将其与普通键盘输入区分开来。 请注意,我尝试了在线找到的大多数软件,如 Footswitch 等。没有什么能够识别它,或者与输入按钮区分开来。 我想将开关变成播放/暂停按钮。 ...
假设你的计算机正在将音频(某人说话的声音)转录为文本。由于它正在查看音频的数字值,因此它“渲染”转录的速度是否比实时播放转录所需的时间更快?我认为它不是像人类一样“聆听”,而是以数字方式处理转录。我的这个假设对吗? 同样的问题也适用于视频分析。 我的困惑是:当以更快的速度播放音频时,单词变得不清楚,那么计算机如何弥补这一点?如果我在这里遗漏了一些基本的东西,请原谅。 编辑:当我在这个问题中使用“实时”一词时,我的意思不是在录制时,然后实时转录。相反,我指的是以 1 倍速播放(或实时播放速度)。似乎有些人没有明白我的意思。 ...
我不想通过麦克风转录我的现场演讲。我想转录硬盘上以前录制的 MP3 文件。 我在 YouTube 上看过一个视频,发现它需要两台带有特殊电缆的设备。我该如何只使用我的电脑来做到这一点?或者只使用我的智能手机? 我可以使用 PC 和智能手机,但我不喜欢特殊的电缆。我可以使用 USB 电缆或蓝牙。 ...
当我在 YouTube 上上传音频文件(和图片一起)时,它无法识别单词。音频质量相当于便携式录音机;对我来说,单词足够清晰。有没有办法提高音频质量?我已经尝试用 Audacity 这样做了,但质量变差了。提前谢谢您。 PS我知道youtube的转录不准确,但这不是问题,最重要的是识别音频文件。 ...
是否有可能以奇怪的字体快速转录大量文本(例如 BulletMix 之类的东西:https://www.fontstock.net/4041/bulletmix.html)?我可以使用 Photoshop,但更希望使用在线方法。我在网上查过,但无法找到正确的 Google 搜索,因为没有字体识别器(我已经知道文本使用的是什么字体)。任何帮助都非常感谢! ...
我正在听音频对话,并据此创建互动摘要。这不是逐字转录。我需要在各处放置时间戳引用。我如何复制和粘贴时间戳。目前我必须目测时间戳,然后输入“[41:58]” ...
我正在尝试使用基于 XP 的系统的 USB 脚踏板来播放/暂停 .mp3 文件。踏板能够学习任何组合键或每次按下时发送一个字符串。我们尝试过使用 Windows Media Player,它会通过发出“空格”键输入来停止/启动;但是,问题是用户正在使用 Microsoft Word 进行转录,并且当她输入时 Word 处于焦点中。理想情况下,USB 触发的任何命令也会使 Media Player 处于焦点中。这几乎就像需要另一个宏类型程序参与其中,该程序足够智能,可以找到 Windows Media Player 窗口,并在按键时停止和启动它…… 顺便说一...
适用于 Mac 的最佳语音转文本软件是什么?我需要转录长达一小时的音频,我真的不想手动完成 :-)。 我更喜欢免费选项,也喜欢开源,所以如果有项目的话我很想了解。欢迎大家回答。 ...
我每天都会听一个时长约 4 小时的播客。我认为如果我能想出某种方法来自动生成播客的文字记录,那将是一个很酷的项目。有没有软件可以“收听” mp3 并创建他们所说的文本? 我不太在意区分谁在说话,因为我觉得这要求太高了。有 4 个主要人物在说话,其他人说话不多。 ...