之前看到演示的 gpt-4o 语音对话,牛逼的不行不行的,但是好像也没有看到论坛里面的人讨论。我平时用 poe 里面的 4o ,确实不错,虽然只有 10 次/天,但是始终没有体验到演示的那种语音对话版的 gpt-4o 。各位,有什么办法吗?
1
jonsmith 2024-07-31 16:29:57 +08:00 via Android
chatgpt APP ,要开 plus 会员
|
![]() |
3
wuud 2024-07-31 17:35:25 +08:00
如果是安卓,需要美区的 google 账号使用 google play 安装 chatgpt 安卓版本,登录就可以用了
|
![]() |
7
windliang PRO 还没全量,前几天刚开始灰度,运气好就能用到
|
10
lDqe4OE6iOEUQNM7 2024-07-31 18:35:55 +08:00
@apollo007 只是部分人有实时语音,全量要到秋天了
|
11
lDqe4OE6iOEUQNM7 2024-07-31 18:36:26 +08:00
@apollo007 旧的语音老早就有,普通用户都有
|
![]() |
12
flynaj 2024-07-31 20:06:46 +08:00 via Android
豆包一样的。差别不大。
|
![]() |
13
evan9527 2024-07-31 20:28:30 +08:00
有没有可以用第三方 API ,又能语音对话的 app ?
|
14
jip 2024-07-31 20:58:17 +08:00 via Android
试试豆包,也还行
|
![]() |
15
t41372 2024-07-31 22:34:52 +08:00 via Android
只有实时语音对话的话挺容易的,chatGPT app 还有很多别的项目都可以实现。
纯本地的话有个叫 glados 的项目,我自己也写了个叫 Open-LLM-VTuber 的项目(借楼宣传一下我自己的开源项目,抱歉),能实现纯本地(mac, win, linux)本地实时语音对话以及 live2d 的小人偶,且大模型,语音识别,语音合成都支持多种不同的模型,可以很轻松的替换,还能配置基于 memgpt 的长期记忆。 https://github.com/t41372/Open-LLM-VTuber/ 不过也有很多别人的项目实现了类似的东西,我这个项目也只是在很早期的状态。如果有兴趣可以来瞄两眼... |
17
wOuv7i4e7XxsSOR1 2024-07-31 22:50:15 +08:00
我的账户好像有实时语音了
|
![]() |
18
yuuluu 2024-08-01 01:02:06 +08:00 ![]() 上面说豆包的,是在打广告吗。
这俩语音完全不是一个东西吧。 一个是端到端的,一个是文字转语音。 |
![]() |
19
apollo007 OP @jdkxnktkdkxod 跟它语音交流有延迟吗
|
![]() |
20
apollo007 OP @yuuluu 目前打断说话还得需要点一下豆包,感觉像不一样,但是又好像差不多,说不上来。反应速度挺快的
|
21
sunzhuo 2024-08-01 09:15:13 +08:00
豆包差太多了吧,基本的翻译都做不到
|
![]() |
22
robyn87leonard 2024-08-01 11:32:42 +08:00
我挂了梯子 gpt 的客户端就会提示不让用 vpn 这咋弄
|
23
Ethanccc 2024-08-01 12:06:11 +08:00
@robyn87leonard 说明 ip 不好,如果是自建的需要套 warp ,而且客户端语音功能还需要支持 udp 的节点
|
24
wOuv7i4e7XxsSOR1 2024-08-01 13:38:10 +08:00
@apollo007 有延迟,体验不如豆包
|