有没有朋友想一起拼一个 chatgpt 蓝牙音箱

2023-04-23 22:07:45 +08:00
 Jackyxiaoc
如果是只有一个人玩玩,搞一个能链接 chatgpt 的蓝牙音箱有点划不来,有朋友们想用的么,如果想玩的人多了,就开个团搞搞。预计成本 300 左右。

产品名称
chatgpt 蓝牙音箱

需求描述
该产品由树莓派和国产蓝牙音箱组成。
树莓派链接 chatgpt 接口,为用户提供语音服务。
该 chatgpt 蓝牙音箱服务端部署在用户自身的微软云账号上。
该 chatgpt 音箱主要用到微软云的 serverless 和语音转换等接口。
用户第一次使用该 chatgpt 的蓝牙音箱时,需在页面填充 openai 和微软云的 key 。
该产品无广告。

产品介绍:这是一款由树莓派和国产蓝牙音箱组成的产品,旨在为用户提供与 ChatGPT 语音服务的连接。它可以通过蓝牙连接到其他设备,使您可以享受到 ChatGPT 提供的语音服务。对于该 ChatGPT 蓝牙音箱,您需要将树莓派与 ChatGPT 接口连接起来,以提供语音服务。 服务端部署在您自己的 Microsoft 云账户上,其中使用了微软云的 serverless 和语音转换等接口。 第一次使用该 ChatGPT 蓝牙音箱,您需要在页面上填写 OpenAI 和 Microsoft 云的 API Key 。我们相信这款产品将会给您带来非常好的用户体验。
6212 次点击
所在节点    奇思妙想
55 条回复
ropzislaw
2023-04-24 11:53:17 +08:00
这个 idea 我也有过,最后被劝退了
1. 需求多了生产线怎么弄,如何保证自己的生产线成本低
2 延迟和输出延迟
3 实时数据缺失
Jackyxiaoc
2023-04-24 12:28:02 +08:00
@mway 感谢。
@luckjoe680 小爱的智能水平和 chatgpt 不太一样。
@lloovve 感谢,我研究下。
@musi 在家常驻使用比较舒服。
@Tink 确实是个好办法,感谢。
@yuchenxing 我研究下路径,如果可以的话,一起拼个单,组好了大家用,成本就下来了。
@hoky 还是得有稳定的通道。
@totoro625 长时间接着电源的小音箱在家小朋友什么的好玩。感谢,我研究下。
@Biluesgakki 流式的话,这个得研究下。大概 10 个字一读会不会好点。
@timeance 感谢支持,我研究下。
@yfmir 估计得内置一个通道才行。
@aeli 目前看是的。看看有没有更好的解决方案。
@zagfai 如果更智能应该是个更好的体验。
@ropzislaw 只是一个初步想法,天猫精灵的话二手成本是挺低的。如果单纯是树莓派的解决方案,树莓派也不会很贵。延迟这个通道可以解决。实时数据的话,可以导入谷歌的。

感谢各位大佬们的建议。
tags
2023-04-24 13:51:38 +08:00
不错不错,可以先在 linux 虚拟机上把系统搭起来,后面用啥硬件平台可以再说
Socrazy
2023-04-24 13:55:45 +08:00
Siri 上用了,其实很无聊,简单问题还行,太长的听起来很累
freetree
2023-04-24 13:57:41 +08:00
华强北听到了你的呼求😁
yulgang
2023-04-24 14:01:28 +08:00
想法不错,但是树莓派成本有点高。。
lambdaq
2023-04-24 14:02:05 +08:00
@Socrazy 可以进一步搞点人设的 prompt 吧
yulgang
2023-04-24 14:05:14 +08:00
如果你能开源的话,大家喜欢,可能会衍生出多个版本,不过一定会有人用你的开源代码拿去赚钱。😂
Jackyxiaoc
2023-04-24 14:19:19 +08:00
@tags 对,可以先测试下反应速度啥的,看看这些问题能否解决。
@Socrazy 感谢,我先试试。
@freetree 哈哈哈哈,如果有成品了直接买也是不错,不用自己折腾了。
@yulgang 树莓派确实成本有点高,不过开源代码拿去赚钱这个国内很常见了。
@lambdaq 对的。
dangyuluo
2023-04-24 16:09:58 +08:00
直接用 Siri 就可以接入 ChatGPT 了
Jackyxiaoc
2023-04-24 16:30:24 +08:00
@dangyuluo 不知道咸鱼上 300 的 6s 能不能跑,如果可以的话,也是不错的选择。
cloudzqy
2023-04-24 17:31:36 +08:00
这种自己走微软云文字转语音的,一般用什么方案识别关键字然后开始对话呀,如果一直开着的话,微软云也挺贵的。
westoy
2023-04-24 17:39:57 +08:00
做公开服务成本太高了吧

京东的那个叮咚音箱都倒闭了.......
zapper
2023-04-24 17:42:12 +08:00
看了一下(可能是生成的)产品介绍。发现好像没说如何正确地拾音给 chatgpt

所谓悲观者常常正确,乐观者往往成功。如果能接入插件将绝杀
tags
2023-04-24 17:44:54 +08:00
唤醒词本地离线模型就能跑
Jackyxiaoc
2023-04-24 18:11:25 +08:00
@cloudzqy , @tags 大佬提供的方案是本地模型去识别关键词。谢谢 @tags
@westoy 公司去做估计是难,利润空间不大,这个只是想做着自己玩玩的,给家里人也体验下 chatgpt 。
@zapper 有道理。
webdesigner
2023-04-24 19:23:27 +08:00
从我使用 gpt 连接 siri 的体验来看,这个项目做出来体验会很差。api 目前要么用 sse 逐字输出,要么牺牲响应时间等待全部结果。逐字输出文字转语音效果会很差,一个一个字朗读。等待全部结果在朗读,用户响应时间特别长,你无法想象当你问完一个问题,就得等待十几秒钟来告诉你答案。如果这个方案可行,大厂早就整出来了。
hanguofu
2023-04-24 21:18:38 +08:00
@tags : 本地离线模型是指 whisper 吗 ?有没有更好的?
wellqq
2023-04-24 21:26:45 +08:00
按你目前的阶段,感觉离成品还有一些路要走,不过有出来体验好我会买,有众筹通知一下
fresco
2023-04-25 00:10:37 +08:00
一直在找能语音对话的 app ,这个想法不错,成本低点就好了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/934894

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX