当前有哪些适用于 Linux 的转录或听写软件包?

当前有哪些适用于 Linux 的转录或听写软件包?

摩斯拉深度语音项目很有趣,但可能不够复杂。至少我的结果并不令人印象深刻。

在线转录或听写服务很好,但是离线软件包将是首选。

这在 Linux 和开源软件中不是很常见吗?希望从 mp3 文件中获取转录。

不想上传文件或使用使用类似此类服务的 API。

答案1

我用沃斯克对于普通话来说,它对于一般相对较短的句子非常有效。

它完全离线运行。我在 Raspberry PI 3B+ 上安装了它,硬件要求非常基本。

答案2

警告:您没有指定您是否期望找到实际的自动语音转录器工具或基本转录器工具。

我想说,如果您实际上期望/希望找到真正的语音识别,那么您的运气将为零,但如果您想要更标准的方法,请尝试以下方法:

Package: gtranscribe
Description-en: simple GTK+ tool focused on easy transcription of spoken words
 gTranscribe is a simple GTK+ tool to transcribe audio files and other
 sources. The playback speed can be adjusted without changing the pitch of the
 voice. It supports spell checking and resuming at the last transcribed
 position.
Tag: implemented-in::python, interface::graphical, interface::x11,
 role::program, uitoolkit::gtk, use::TODO, works-with-format::mp3,
 works-with-format::mpc, works-with-format::oggvorbis,
 works-with-format::plaintext, works-with-format::wav,
 works-with::audio, works-with::text, x11::application

或者

Package: transcriber
Description-en: transcribe speech data using an integrated editor
 Transcriber enables easy transcription of recorded speech.
 It is indispensable for every task that involves examination and
 transcription of audio files, like transcription of recorded interviews, song
 lyrics, radio shows and so on.  It is also useful if you are active
 in the field of speech research.

您的用例将决定一个是否适合您,因此您无能为力,只需安装它们并试一试,看看它们是否适合您。

答案3

尝试书呆子听写,它支持听写并模拟键盘输入,参见演示视频

(基于优秀的VOSK-API)

相关内容