完全语音控制不可行,但“语音快捷键”越想越可行啊,举几个特别有用的例子

2018-05-18 12:36:21 +08:00
 SuperMild
假设现在的电脑加入“语音快捷键”功能(可自定义)

比如喊 “截屏” 就截屏
比如喊 “中文” 就切换到中文输入法
比如喊 “选择” 就自动选择当前鼠标指向的单词,再喊 “一句” 就扩大选择一句,再喊 “复制” 就复制了。
比如播放 PPT (或看 PDF )时,喊一声 “过” 就切换到下一页,手就不用一直放在鼠标或键盘上了啊!

还有一个重点,如果加入了语音快捷键,那就可以解放很多快捷键出来了,大大减小了快捷键冲突的几率。

越想越觉得,有语音快捷键作为辅助非常不错,是辅助,不是强迫使用,就像鼠标手势一样,不爱用的人不用,爱用的人用,应该有不少一部分人会喜欢这个辅助功能的。
4708 次点击
所在节点    奇思妙想
39 条回复
IceBay
2018-05-18 13:22:28 +08:00
siri ?
zj299792458
2018-05-18 13:25:06 +08:00
在公司大喊一声,关机,群体员工都可以下班了。
zj299792458
2018-05-18 13:25:18 +08:00
@zj299792458 全体员工
SuperMild
2018-05-18 13:35:09 +08:00
@IceBay 功能 Siri 有很大区别,Siri 偏重于人工智能,因此需要联网,速度慢。我说的是类似于鼠标手势的东西,反应速度可以很快。

@zj299792458 影响多台机器的问题,不是难题,有很多办法可以解决。
taojing10
2018-05-18 13:41:21 +08:00
截图?截哪块?是不是还是 qq 微信快捷键更容易控制?
jiuu
2018-05-18 13:45:50 +08:00
那是不是还需要一个开启“开启语音快捷键”的快捷键呢?那就两步了。
如果一直开启,那你就知道外面世界的声音有多美妙了。
楼主不是做产品的,是个程序猿吧。
SourceMan
2018-05-18 13:52:36 +08:00
你说的这些可能连自己都没有说服吧,打回去重想
chenyu8674
2018-05-18 13:54:41 +08:00
“小李啊,这个需求你搞清楚了没”
“清楚,清楚……艹!没让你个傻逼清除!啊张总我没说你……”
SuperMild
2018-05-18 14:43:29 +08:00
@taojing10 快捷程度是一样,不分上下。但键盘快捷键占用一个少一个,语音快捷键是额外的,不占用键盘。
est
2018-05-18 14:54:49 +08:00
已经回复了多次,其实脚踏板才能增加生产力!
fate
2018-05-18 14:57:25 +08:00
当你在王者荣耀里团战时,有人喊了一声 siri
dex2jar
2018-05-18 15:04:31 +08:00
喊截屏,然后整个屏幕截下来了?然后咋办?自己裁剪?
还是喊截屏 qq 聊天记录框,不截取头像?
喊中文这个倒是可行。。我半秒种按快捷键解决的,你得讲话,然后等待识别成功,然后等待切换,然后继续输入。注意,这里有个必然的等待时间,因为语音识别肯定要认定你讲完话了,而不是你讲一点就干活对吧。
然后选择。。额,你在干啥,你鼠标都在这个字旁边了,然后你不想动半秒钟的鼠标,却让他自动判断位置?万一你想多选择一点呢。。
ppt 这个倒是好主意。
ZiLong
2018-05-18 15:07:03 +08:00
@zj299792458 这个场景太美
SuperMild
2018-05-18 15:08:10 +08:00
@jiuu 重点是“语音快捷键”这个概念本身好不好,具体解决办法可以慢慢想,总有办法解决的。我暂时想到几个方法:

1. 根据使用场景自动开启

- 比如,在微信窗口输入文字,从停止输入起算 15 秒内,自动开启语音功能,此时可以识别“发送”命令,喊出该命令就发送,从此不再迷惑是 enter 发送还是 Ctrl+enter 发送了。

- 又比如,在播放 PPT 时,自动进入状态,可以识别 “下一页” 命令。

2. 检测周围噪音,当比较安静,或者噪音有规律可以过滤掉时,自动开启语音功能。

3. 随时手动开启语音功能

4. 现在一般屏幕都有摄像头,或可以轻松加装。以后眼神操控也将会进入主流,因此,摄像头一直监控使用者状态将会被消费者接受,那么,可以通过“持续目视镜头 3 秒”来临时开启语音,此时喊语音功能有效,1 分钟后自动关闭语音。

5. 增加外设。一个形状大小像录音笔一样的无线麦克风。

当然,这只是初步想法,细节做好了才能实用化。但重点是,办法总是有的。
liuxey
2018-05-18 15:08:29 +08:00
语音辅助大方向是可行的,但切入点目前还没完整把握好,再等等看吧,语音+AI 结合可能更好找到切入点
SuperMild
2018-05-18 15:13:37 +08:00
@dex2jar 识别时间是个大问题!想起锤子的 TNT 产品,演示时很流畅,不知道是否解决了这个问题。按照演示情况来看,识别是瞬间完成的。但如果演示有假,那…… TNT 产品可能会遇到致命的麻烦。
HypoChen
2018-05-18 15:17:33 +08:00
- “连根拔起”
- rm -f /
dex2jar
2018-05-18 15:18:57 +08:00
@SuperMild 我看过一点后来的视频,比如老罗喊,红色,是停顿至少半秒以上才变色的。。而且他这个场景下比较单一,就变颜色和字体,所以可能识别快一点?如果他自然语音一点,比如 把标题的颜色改成红色。 这时候肯定是有个停顿识别的过程的。
SuperMild
2018-05-18 15:23:29 +08:00
@dex2jar 那看来还是要等技术进步,看什么时候有大厂去优化识别问题了。我主要是提出语音辅助很好用,如果细节做好的话。
Luckyray
2018-05-18 15:26:33 +08:00
语音再快也快不过手指头...至少在生产力工具方面,你举得例子都不合适,按一下截屏键或者快捷键不比说几个词快多了。

真想让语音发挥作用,还得强人工智能出现,你几个字描述一个复杂的任务,他就能去执行。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/455867

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX