对于 Linux 中的语音听写,您有何建议?

对于 Linux 中的语音听写,您有何建议?

好的,所以我正在寻找一个简单的实时听写工具,可以在 Linux 中本地运行,而不是基于网络的应用程序。

对于上下文,我在 Google 上四处查看,查看了其他 SE 帖子,以更模糊的方式询问了同样的事情,询问了 ChatGPT,在 GitHub 上四处搜寻,等等。

其中,上面推荐了多种工具,包括 vosk、sphinx、transcriber 和其他一些工具。他们中没有一个对我来说非常成功。

我尝试过在基于云的 MS Word 版本中使用听写。这是成功的,但我更喜欢非基于云的工具

我想要实现这个的发行版是 Debian。

有人对我可以尝试的替代工具/包有什么建议吗?

更新:这个答案最有帮助: https://unix.stackexchange.com/a/772356/537545

感谢 Marcus Müller 提供的指导,我已经设置好 SpeechNote 并开始工作,我非常感谢他。

我将测试 SpeechNote 中可用的众多英语语言模型,并将在某个时候添加额外的更新,以确定哪一个模型在速度、准确性和缺乏自动垃圾插入方面似乎是最佳的(“感谢使用此软件”类型的插入)

同时,如果人们有任何其他软件建议,请随时添加进一步的贡献。

谢谢你们 :)

答案1

你可能想尝试演讲笔记;我有时会在组装东西时做笔记时使用它,因此空闲的双手有限。

我有很明显的德国口音,但对于我说的大多数英语来说,它的表现已经足够好了。它不会执行“直接输入我的文字处理程序”之类的操作,但就您的问题而言,我认为这并不是严格的要求?

Speech Note 是什么,是几个语音模型神经网络的前端;它不是最新最好的,但说实话,Whisper 对于英语来说还不错。正如评论中提到的,大多数语音识别工作都是在运行 Linux 的台式机上完成的。

我有从 Flathub 安装的;由于您的笔记本电脑没有可以比 CPU 更快地进行推理且功耗更低的 GPU,因此安装任何加速器插件都是没有意义的。因此,要在 debian 上运行,您需要设置 flatpak,然后安装 Speech Note 程序,然后运行该程序,并选择适当的英语模型。

我还没有在 debian 上测试过这个,但是从扁平包文档来看,这应该可以工作:

# Check whether flatpak is installed, and install it if not
flatpak --help > /dev/null || sudo apt install flatpak -y
# end of debian-specific instructions.

# Set up the flatpak software repo
flatpak remote-add --if-not-exists flathub https://dl.flathub.org/repo/flathub.flatpakrepo

# Install Speech Note in container environment
flatpak install net.mkiol.SpeechNote

我不知道这是否足以让 debian 拥有 SpeechNote 的菜单项;无论如何,你可以直接启动它

flatpak run net.mkiol.SpeechNote

现在,单击“语言”按钮,然后选择“英语”。从“语音到文本”中选择“English (FasterWhisper Small)/en”,然后单击其下载按钮。等待下载完成。关闭对话框;进入左上角的汉堡菜单汉堡菜单图标图标,转到“设置”,转到“语音转文本”,然后选择正确的音频源。关闭对话框。

你已经准备好了——点击“聆听”按钮,成为一个仁慈的独裁者!

编辑:这是它的实际应用(请确保取消视频静音)

视频

相关内容