请教关于 Ai 虚拟数字人的问题

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 501 天前的主题，其中的信息可能已经有所发展或是发生改变。

请教下 v 友们有没有做过 Ai 虚拟数字人相关的业务，就类似那种在展厅内通过显示设备展示的虚拟人物，能够回答观众的问题，整体流程我之前有过大致的了解，基本上是这样

语音输入->识别文本->LLM->文字情感分析（想干掉）-> 语音生成 -> 视频生成 -> 驱动数字人 -> 设备展示

目前大概率是想自己实现整套流程，包括展示设备的对接，有下面几个问题想请教下搞过的 v 友：

1.整体流程有没有开源的整合方案？ 2.展示设备怎么去对接？有合适（便宜好用）的设备推荐吗？

9 条回复 • 2024-06-18 09:24:47 +08:00

Yuhyeong

2024-06-17 15:36:40 +08:00

没什么开源的吧。情感分析确实没啥必要感觉。
我做过数字人聊天的，但是做的是图像生成部分，和你的目标差的比较大，展示设备不就正常大屏幕就可以吗。

nx6Ta67v2A43frV2

2024-06-17 15:39:41 +08:00

云厂商有智能客服，花点钱购买 API ，然后调一下语料库，套个壳子。

ErnestSu

2024-06-17 15:44:47 +08:00

思必驰/讯飞(asr)+chatgpt+思必驰/讯飞/微软/百度(tts)+相芯科技数字人

Hzzone

2024-06-17 15:54:23 +08:00

调 api 吧，你自己实现最多用开源模型，出问题你也不一定有能力解决

monmon

2024-06-17 16:25:07 +08:00

流程有点问题，应该先从“谁来买你的设备？”开始，想想这些虚拟数字人在哪些场景比较常见，医院、xx 办事大厅、地铁、商场，如果你能让他们买你的设备，剩下的部分找个差不多的外包公司就做做了

t41372

2024-06-17 17:00:03 +08:00 via Android

https://github.com/Ikaros-521/AI-Vtuber
可以参考一下这个项目吧我感觉挺猛的
我自己也在尝试类似的项目，写了一段时间了，不过水平比较菜。

mmdsun

2024-06-18 09:10:10 +08:00

国内外有很多现成了，想接入 GPT-4 可以用微软的，
https://learn.microsoft.com/zh-cn/shows/ai-show/advanced-azure-openai-solutions-with-tts-avatar

不想花钱就找 github 开源方案

aliyun2017

2024-06-18 09:19:24 +08:00

前几天刚做的业务用的腾讯的语音识别转文本 ai 能力：openai ，接受文本结果，文本驱动数字人，
语音识别： https://cloud.tencent.com/document/product/1240/104050
数字人： https://github.com/TencentCloud/virtualman-render-demo

aliyun2017

2024-06-18 09:24:47 +08:00

@aliyun2017 数字人去控制台定制就可以了，都有免费额度。接入设备大屏那些一版都是安卓系统，用 h5 开发套 apk 壳子，后续更新 web 页面就行