~~副标题 1:我比产品经理聪明系列~~
~~副标题 2:反正产品经理不需要文凭~~
老罗原话大意是
现在讯飞语音输入的准确率是 97%,但即使提升到 99%也没有什么用,不用的用户仍然不会去用。只有 99%提升到 100%才是质变。
首先,只要语音识别仍然是基于统计模型,无论算法有多么大革命性变更,计算平台的计算能力如何提高,准确率都不会达到 100%,只会无限趋近。 其次,无论是人和人之间的声音交流,还是在 PC 上用键盘输入文字,信息传达的准确率都不是 100%的。 这说明「输入」错误本身并不是那么让人不可接受。
不妨先从数学角度看看这个问题。
假设语音输入的准确率是 a,输入正确和错误给用户带来的厌烦程度(以怒气代称,包括所有疲劳等等消极情绪)分别为 CR 和 ER。那么用户输入时的怒气值计算公式为
Rage = a * CR + (1 - a) * ER
在输入正确时假设用户产生的疲劳程度趋近于零,那么总的厌烦程度很简单,约等于错误率乘以修正错误产生的 Rage。那么从 97%提升到 99%带来的其实是 3 倍的优化,也就是将总的 Rage 减少 2/3。
因为用户的怒气值并不是随着输入线性增加的,因为用户往往是一点就炸的,因为用户并不是理性的。 比如一个 app 在手机里几个月不用也躺得好好的,突然某天推送一条通知,从此就再也见不到它了。所以上面的公式并不适用。或者说目前的 ER 无穷大,一旦出现就让用户想放弃了。
在几年前,有这么一个说法:用户宁愿在屏幕上多点十下也不愿意在浏览器地址栏输入一个字母。我当时用的是三星的 I9000,当时 Android 阵营的旗舰之一,但确实是这么感受。因为屏幕又小,浏览器又臃肿,硬件性能有差,而且即使输入完网址,网站也很少有为智能手机设计的。就是实际上不可用的状态。但实际上随着近几年天翻地覆的变化,很多网站我已经宁愿去输入网址也不想装他的 app (说的就是你,淘宝)。
其实这就是屏幕输入 ER 值大幅下降,并且退到了用户立刻骂娘的安全线之内的结果。
语音输入也是如此,去年体验了一下语音输入,我的感觉仿佛回到了 20 年前。用过 win98/XP 自带的微软拼音的同学应该明白我说的意思。 这也是为什么老罗说只有到 100%才是质变。但我的个人看法,现阶段有执行性的方向应该是如何优化用户输入错误时修正错误的体验。如果退回爆炸的「红线」之内,才是目前问题的根本所在,也是手机厂商能力的优势所在。老罗实际怎么想的不知道,但表现出来的情况来看并没有对修正操作的优化足够留意。实际上在输入正确时语音的输入体验是大幅优于键盘的,也就是公式
Rage = a * CR + (1 - a) * ER
的前半部分,a * CR。那么只要修正错误的成本降低到接近键盘输入,那么语音输入一定会普及开来的。
一句话结论:错误修正的交互才是目前语音输入的最大瓶颈。在优化好错误修正的操作后,准确率的每一点提升都会给使用体验带来飞跃的变化。
当然以上讨论仅限使用场景为个人独处,在有其他人在场的情况另当别论。
太困了,先到此为止吧,最后祝锤子手机大卖!
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.