ChatGPT 的 stt 是用的 whisper 吗? 感觉比所有其他的语音输入都要强

21 天前
 reDesign
中英文混输比讯飞强,纯中文和讯飞差不多
说的是这个东西

799 次点击
所在节点    问与答
4 条回复
malusama
21 天前
这玩意估计就是模型支持语音的输入输出。。毕竟早就是多模态的了
kyor0
21 天前
4o 是多模台的
cyp0633
20 天前
如果是 whisper ,效果会远不如讯飞
chesha1
20 天前
官方文档里就有: https://platform.openai.com/docs/guides/speech-to-text

The Audio API provides two speech to text endpoints, transcriptions and translations, based on our state-of-the-art open source large-v2 Whisper model.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1081605

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX