V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
iloveoovx
V2EX  ›  Android

目前语音识别的性能到什么地步了?

  •  
  •   iloveoovx · 2017-09-28 16:59:07 +08:00 · 9583 次点击
    这是一个创建于 2611 天前的主题,其中的信息可能已经有所发展或是发生改变。

    想问一下,如果在密码输入这个场景下通过语音来识别字符,性能怎样?

    具体来说,密码输入这个场景意味着

    • 安全性,也就是说可能识别处理最好在本地进行;

    • 相对简单无需智能语义解析,大部分密码就是 0-9 的数字以及 a-z 的字母。在这个基础上,可能会加入一些描述性的综合识别来识别大写字母和符号,比如“大写的 a ”会自动识别成“ A ”,“逗号”识别成“,”,而类似 @则可以支持通过“ at ”和“ a 外面一个圈”等多种描述来输入,甚至加入“后退”等命令来在输入错误时进行删改。

    • 低延时,从发声到识别大概在 100ms 内,让语音输入有打字般的感觉。

    • 在安卓主流高端芯片如 SD835 上运行。

    目前性能能达到这种要求吗?

    9 条回复    2017-10-01 06:14:24 +08:00
    scinart
        1
    scinart  
       2017-09-28 17:48:59 +08:00
    现在离线语音识别各家都有了吧,性能和准确性也应该都不是问题。
    oott123
        2
    oott123  
       2017-09-28 20:06:42 +08:00 via Android
    然后你输个密码你旁边的人都听到了?略尴尬啊~~
    iloveoovx
        3
    iloveoovx  
    OP
       2017-09-28 21:50:19 +08:00
    @oott123 并不考虑这种问题,毕竟这只做一个备用方案就好,适合你独处但手不方便的时候。
    hatw
        4
    hatw  
       2017-09-29 09:58:37 +08:00
    其实目前最大的敌人是。。。环境。。。噪音。。。
    chenyu8674
        5
    chenyu8674  
       2017-09-29 11:41:40 +08:00
    忽略干扰(噪音、口音)的前提下应该不难
    先靠语音听写把语音转为文本,然后按自定义规则对文本进行二次加工
    EmmaSwan
        6
    EmmaSwan  
       2017-09-29 11:51:13 +08:00
    我觉得比较合适的做法是,特定语汇自动替换,比如你说"美女",识别并转换为 A.你说丑女,为 B.这样,别人听到也没啥
    chenyu8674
        7
    chenyu8674  
       2017-09-29 13:04:23 +08:00
    @EmmaSwan 考场中学霸突然扔笔大喊操,啊,大爷的,操,八嘎,学渣默默涂上 CADCB 么 =。=
    parametrix
        8
    parametrix  
       2017-09-29 14:11:03 +08:00
    结合声音特征的 生物+密码 混合认证应该可用性更高吧,公开场合也不担心别人听去了。

    “适合你独处但手不方便的时候”这种场景真是让人浮想联翩。。。(滑稽
    iloveoovx
        9
    iloveoovx  
    OP
       2017-10-01 06:14:24 +08:00
    @parametrix 哈哈,其实是 AR 或者 VR 的时候,没有实体键盘可用
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   984 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 20:36 · PVG 04:36 · LAX 12:36 · JFK 15:36
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.