苹果说激活 siri 的语音指令由“Hey Siri”换成“Siri”有很大的技术难度

2022-11-10 11:25:59 +08:00
 hello267015

有懂这方面大佬给科普下吗

这难在哪???

CURD 码农表示不就是把激活的判断条件改一下吗 😂😂😂

6168 次点击
所在节点    程序员
36 条回复
cyningxu
2022-11-10 18:26:24 +08:00
个人感觉这个应该和误唤醒相关。hey siri 音节多便于识别且日常生活中较少使用,但 siri 音节少识别较难,且相较 hey siri 而言使用频率会高很多。比如“我感觉 siri 挺智能的”,但较少人会说“我感觉 hey siri 挺智能的”。如果仅是将==右边由“hey siri”改为“siri”,没有其他方面的提升,那这个使用体验会大打折扣。感觉苹果应该是在这方面下了很大的功夫,用以保证至少在他们的测试流程里,“hey siri”和“siri”的误唤醒率差不多。以上为个人见解,若有误望轻拍。
admpubcom
2022-11-10 18:28:45 +08:00
@bthulu cc @小爱音箱开发人员
ajyz
2022-11-10 18:38:30 +08:00
音节越短,容错越低
ThinkMan
2022-11-10 18:40:07 +08:00
之前在国内过 AI 语音行业。
当时我们中文推荐的是 3-5 个字,2 个字坚决拒绝(主要是误唤醒率非常高)。4 个字算是最佳,能平衡唤醒率、和误唤醒率,且“ABCD”好过“ABAB”、“AABB”等类型唤醒词。
当然手机上,除了做唤醒识别之外还会加声纹识别,以减少误唤醒。
nightwitch
2022-11-10 19:15:25 +08:00
在连续的数据里识别分析,难点不在于某个片段的识别准确率,难点在于从连续数据里找出片段的起始和结束。
Iamsonny
2022-11-10 19:21:47 +08:00
唤醒词越短,技术难度越高,误唤醒率太高了。
ixcode
2022-11-10 23:02:51 +08:00
只要还需要唤醒词,人工智障永远都是智障
AOK123
2022-11-10 23:21:12 +08:00
所以谷歌还是明智很多,直接叫 Alexa ,个人感觉误判率比 Hey Siri 都低。。。
HolliZod
2022-11-10 23:43:41 +08:00
没那么简单的,大多数公司都只能实现四个音节,苹果三个音节已经独步很久了
lbingl
2022-11-11 02:56:55 +08:00
@AOK123 Alexa 是亚马逊的,谷歌的也是 Hey Google
yaoyao1128
2022-11-11 07:45:35 +08:00
@AOK123
@lbingl
Alexa 是亚马逊,但是谷歌在不同地区的官方唤醒词分为 okey google 和 hey google 两种(甚至英语不同地区不同……),之后理论上都能用

@marcong95 同意,并且韩语的唤醒是 siri 呀

个人认为唤醒的问题是,以前本身是由语气词进行的主体判断。当 siri 这个词独自出现时的误唤醒概率因为一定需要语气词所以降低了。大概的逻辑就是碰到 siri 不说话,但是 siri 和固定的语气词在一起了那大概就是叫 siri 了。
yytbob
2022-11-11 08:59:18 +08:00
别人提你名字的时候不一定是在叫你,也可能是在你别后谈论你。Hey Siri 可以排除这个情况。
abvatous
2022-11-11 09:47:57 +08:00
主要是为了防止被误唤醒吧
weizhen199
2022-11-11 10:36:44 +08:00
Siri 很明显是个昵称嘛,叫 Siri 全名就行
Speech Interpretation & Recognition Interface

(逃
laqow
2022-11-11 11:30:27 +08:00
不外乎优化一下模型,就是懒得弄而已,以后编不下去了加个 if 就是个卖点
dreamkuo
2022-11-11 21:17:08 +08:00
苹果可以唤醒+内容同时执行, 别的要先唤醒进入监听状态,然后再说内容

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/894081

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX