用户要求提升,需要在语音识别时,区分不同的人,有什么好的方案?

31 天前
 XinPingQiHe

老用户的要求提升:需要在语音识别时,区分不同的人,不知目前有什么好的方案? (注,用户愿意付费升级。我们原来对接的是腾讯语音识别)

1638 次点击
所在节点    程序员
6 条回复
ferock
31 天前
声纹识别,可以识别 A 用户和 B 用户的区别…
forgottencoast
31 天前
以前用过 IBM 的 demo ,好像最多可以识别 4 个人。
easychen
31 天前
呃,这个好像是常规需求啊,腾讯云都支持吧。

不知道你的需求具体是啥,如果是在一堆固定发音人中识别,腾讯云貌似自己有接口 https://cloud.tencent.com/document/product/1093/94481

如果是对话中区分不同的说话人,腾讯云的接口也有 说话人分离参数 SpeakerDiarization 和 SpeakerNumber
https://cloud.tencent.com/document/product/1093/37823

当然,效果如何就要自己测试了…
leconio
30 天前
Latin
30 天前
XinPingQiHe
29 天前
刚注意到 还有这个接口 谢谢二位提醒 @easychen @Latin

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1081852

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX