很好的朋友最近想开发一套直播数字人。我也看了一下市面上现成的,功能上基本大同小异。 因为我从没接过这方面的需求,没这方面项目经验。也找了一点资料,只了解了一点皮毛,整体比较模糊,还没有一个较清晰的开发思路。 预算不高,不可能做像某飞某度那种大厂方案自己做训练学习。自己做训练学习太烧钱,这块不太现实,所以大体方向还是用开源框架,调用各 api 做整合(具体哪些平台和接口比较好用的可以推荐一下,gpt4 就不用提了),其余的用户基础部分自己写。 使用自己的视频,克隆自己的形象这块还不太清楚。最终实现能使用用户自己形象和动作以及语音,减少用户在系统上复杂性操作,轻松简便用到做直播上。 希望各位有经验的吴彦祖,各位大佬能指点一二,少走点弯路。感谢
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.