对桌面环境的语音控制

我想启用一个系统,它可以响应用户语音命令并根据口头命令GIVEN运行脚本。

理想情况下,我希望计算机能够不断地收听。

一旦它听到热门词“计算机”,它将激活并监听命令10秒钟(左右)。

一旦激活,当它正在收听时,我希望另一组流行语能够运行脚本。

例如….

(计算机闲置)“计算机”(计算机立即收听)“访问新消息”(消息是流行语* IGNORES“ACCESS NEW” – 计算机运行脚本并打开进化或同理心)。 可能有一个用于浏览器,一个用于关闭窗口和显示桌面,或者一堆东西。

这有可能吗?

侏儒语音控制

作为Google Summer of Code 2007的一部分开发,这是一个开发一些function的想法,这些function将提高Gnome桌面的可用性。

目标是实现桌面语音控制系统。 该系统包括一个监视音频输入(麦克风)的应用程序,当检测到重要的音频信号时,软件捕获,处理和识别信号,然后通过Gnome桌面执行所需的操作。 在一组动作中可以包括最大化,最小化,关闭活动窗口; 开设一个具体的计划; 从一个桌面切换到另一个桌面; 等等。 GnomeVoiceControl在C中与CMU Sphinx一起实现,CMU Sphinx是一个开源工具,用于将语音转换为文本。

作者幻灯片放映

不幸的是,它似乎没有超出基本的“目标” – 但是似乎有一些活动在今年增加了对新语言(如保加利亚语和土耳其语)的支持。

安装:

sudo apt-get install gnome-voice-control 

鸭嘴兽

有一个有趣的项目调用platypus – 基本上是一个Linux自然流言的前端,在Wine中运行。

这个应用程序声名鹊起的是“它甚至可以启动Windows或Linux程序和脚本,例如”启动终端“。

VEDICS

这是一个新的项目 ,它说它适用于Unity界面。

项目页面表示它识别“运行[程序名称]” – 所以理论上你[程序名]可以是你想要运行的任何脚本。

西蒙听

这是一个开源项目,旨在通过最初为身体残疾人开发的语音识别来取代鼠标和/或键盘。

我们可以在这里安装应用程序: ppa:grasch-simon-listens / simon

Google2Ubuntu

Google2Ubuntu是一款可让您通过Google语音识别API使用语音命令控制计算机的工具。

在终端上运行以下命令以安装google2Ubuntu

 sudo add-apt-repository ppa:benoitfra/google2ubuntu sudo apt-get update sudo apt-get install google2ubuntu 

资源

Linux语音识别

它被开发为在Linux发行版下运行,它非常易于配置且易于扩展,支持自定义词典,基于上下文的识别,听写模式和可配置的宏。

要安装Linux语音识别,请转到项目的GitHub页面。 下载ZIP文件并将其解压缩。

然后安装一些依赖项:

 sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation 

在终端中打开解压缩的文件夹(Palaver-master)并执行设置:

 cd /~Path-to-folder~/Palaver-master/ ./setup 

现在只需分配一个热键来启用录制,为了这样做,进入系统设置…>键盘>快捷方式>自定义快捷方式单击加号按钮添加快捷方式,将其命名为语音识别并将命令设置为:

 /~Path-to-folder~/Palaver-master/hotkey 

单击“应用”,单击快捷方式,然后分配热键以激活“语音识别”。

请注意,尚未发布稳定版本,因此不要指望命令在此阶段完全正常运行,将识别许多短语,但不会执行任何实际操作。

Snips.ai

yust在pi3上尝试过它 – 似乎在docker中有潜在的运行

https://snips.ai/