千问发布会上演示语音交互时,如果现场嘈杂,甚至夹杂台下人声,是如何做到语音模型不会误输入的,背后的媒体技术是什么,降噪是如何处理的,是话筒自带降噪还是需要额外佩戴降噪麦克风,如果额外佩戴麦克风,那会不会受到扬声器音响的影响。
如果有性价比比较高的设备,求推荐
如果有性价比比较高的设备,求推荐
1
geomancy Feb 8 via iPhone
如果是特定演示者进行交互,也可以通过识别声纹定位到演示者。
|
3
Cabana Feb 8 via iPhone
阵列麦克风,指向性麦克风,然后再做个实时降噪处理
|
4
Meteora626 Feb 9
这是两码事,现在开源的语音模型都可以区分说话人了,你可以看看阿里开源的 asrfun 降噪、说话人识别 一堆模型
|