给我的 ChatGPT 加了语音功能,貌似效果还行

2023-03-10 09:58:43 +08:00
 nonfu

昨天给我的克隆版 ChatGPT - GeekChat 加了语音支持(语音识别由 OpenAI Whisper 模型驱动):

貌似效果还行,感兴趣的可以试试:GeekChat - 免费体验版 ChatGPT

另外,大家有什么好的靠谱的中文语音 API 欢迎给我推荐,之前没怎么接触过这块。

4687 次点击
所在节点    OpenAI
30 条回复
xujinkai
2023-03-10 10:11:41 +08:00
🤣离涩涩聊天机器人又近了一步
tianyou666shen
2023-03-10 10:29:11 +08:00
拿来练习英语是不是也蛮好用的
nonfu
2023-03-10 10:41:47 +08:00
@tianyou666shen 嗯 是的
laixy9527
2023-03-10 11:10:37 +08:00
题主是用的哪款语音软件或接口?方便透露么
vsitebon
2023-03-10 11:14:00 +08:00
@laixy9527 #4 题主的帖子里面说了,用的 OpenAi Whisper
Metre
2023-03-10 11:20:49 +08:00
结果也搞成语音~
redditer
2023-03-10 11:35:53 +08:00
考虑开源吗?
AoEiuV020CN
2023-03-10 12:06:52 +08:00
现在看 chatGPT 的回复都会脑补出老高與小茉的声音,感觉他们小茉念 chatGPT 的回复声音非常合适,
shuxiaokai
2023-03-10 13:53:33 +08:00
lambdaq
2023-03-10 14:22:12 +08:00
真好。没有叫 geeker
Depth
2023-03-10 14:44:50 +08:00
我已经看到基于 ChatGPT 的英语口语对话练习程序了。很好,很强大!
nonfu
2023-03-10 14:55:10 +08:00
@laixy9527 我用的 OpenAI 接口啊 speech to text 基于最近发布的 Whisper 模型
nonfu
2023-03-10 14:56:44 +08:00
@Metre 可以的啊 把文本生成语音就好了 这种 AI 软件也挺多的 不过成本就上去了 个人扛不住。。。OpenAI 都用不起 我看已经超免费限额了
nonfu
2023-03-10 14:57:45 +08:00
@redditer 已经开源 在 Github 上 你可以关注我的博客: https://geekr.dev ,这两天会把开发过程更新进去 之前写了一篇没有语音的
nonfu
2023-03-10 14:58:48 +08:00
@AoEiuV020CN 哈哈 同好
nonfu
2023-03-10 15:00:51 +08:00
@lambdaq kr 多有感觉 氪星人 化学元素 还有这不能少写一个字母嘛
nonfu
2023-03-10 15:01:54 +08:00
@Depth 理论上没啥问题 个人扛不住这个成本 做个玩具可以 公司就随意了
runliuv
2023-03-10 15:16:30 +08:00
和小爱同学差不多了。
cuicuiv5
2023-03-10 15:22:12 +08:00
我正准备做一个类似的语音助手, 搭配微软 Azure 的 TTS, 效果一定很棒
微软的 api 似乎可以流式传输, 这样可以让他逐字读出来, 体验更好, 不会卡顿
icatme
2023-03-10 15:22:29 +08:00
我想用 ESP32 开发板做一个聊天玩具, 语音->文字->GPT API->TTS 输出

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/922788

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX