通过语音控制桌面环境

通过语音控制桌面环境

我想要启用一个可以响应用户语音命令并根据所给出的口头命令运行脚本的系统。

理想情况下,我希望计算机能够持续监听。

一旦它听到流行词“计算机”,它就会激活并监听命令 10 秒左右。

一旦激活,并且在它正在监听时,我希望另一组流行词能够运行脚本。

例如....

(计算机空闲)“计算机”(计算机立即监听)“访问新消息”(消息是流行词 *忽略“访问新消息”——计算机运行脚本并打开进化或同理心)。可能有一个用于浏览器,一个用于关闭窗口并显示桌面,或者实际上有一堆东西。

这可能吗?

答案1

Gnome 语音控制

作为 2007 年 Google Summer of Code 的一部分进行开发,这个想法是为了开发一些能够提高 Gnome 桌面可用性的功能。

目标是实现一个桌面语音控制系统。该系统由一个应用程序组成,该应用程序将监控音频输入(麦克风),当检测到重要的音频信号时,该软件将捕获、处理和识别该信号,然后在 Gnome 桌面上执行所需的操作。一组操作可能包括最大化、最小化、关闭活动窗口;打开特定程序;从一个桌面切换到另一个桌面;等等。GnomeVoiceControl 是用 C 语言与 CMU Sphinx 一起实现的,后者是一个开源工具,用于将语音转换为文本。

作者的幻灯片

不幸的是,它看起来并没有超出基本的“目标” - 不过今年确实有一些活动增加了对保加利亚语和土耳其语等新语言的支持。

安装:

sudo apt-get install gnome-voice-control

鸭嘴兽

有一个有趣的项目调用鸭嘴兽- 基本上是 Dragon Naturally Speaking 的 Linux 前端,在 Wine 中运行。

该应用程序的卖点是“它甚至可以启动 Windows 或 Linux 程序和脚本,例如“启动终端”。

吠陀

这是一个较新的项目这表明它可以与 Unity 界面兼容。

项目页面显示它识别“运行[程序名称]” - 因此理论上你[程序名称]可以是你想要运行的任何脚本。

答案2

西蒙倾听

这是一个开源项目,旨在通过语音识别取代鼠标和/或键盘,最初是为身体残疾人士开发的。

有一个苯甲酸我们可以从哪里安装该应用程序:ppa:grasch-simon-listens/simon

答案3

Google2Ubuntu

Google2Ubuntu 是一个工具,可让您通过 Google 语音识别 API 使用语音命令来控制您的计算机。

在终端上运行以下命令进行安装google2Ubuntu

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

来源

答案4

Linux 语音识别

它正在开发在 Linux 发行版下运行,它具有很高的可配置性和易于扩展性,支持自定义词典、基于上下文的识别、听写模式和可配置的宏。

为了安装 Linux 语音识别,请转到项目的GitHub页面。下载 ZIP 文件并解压。

然后安装一些依赖项:

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

在终端中打开解压的文件夹(Palaver-master)并执行设置:

cd /~Path-to-folder~/Palaver-master/
./setup

现在只需分配一个热键来启用录音,为了做到这一点,转到系统设置...>键盘>快捷键>自定义快捷键,单击加号按钮添加快捷键,将其命名为语音识别,然后将命令设置为:

/~Path-to-folder~/Palaver-master/hotkey

单击“应用”,单击快捷方式,然后分配热键以激活语音识别。

请注意,尚未发布稳定版本,因此不要期望命令在此阶段能够完全发挥作用,许多短语将被识别,但不会执行任何实际操作。

相关内容