能否用 AI 来生成自己的视频和声音代替自己出镜/录视频?

246 天前
 1014982466
苦于作业太多,而且都是让自己录制非实时,每个 Presentation 作业都要半个小时,但其实重点是 Slides ,自己出镜就是读稿子
假设用自己的数据训练,能否训练出自己的声音+面容,让它帮我朗读,我只要自己写稿子就行了,然后把这段视频和 PPT 录制视频嵌在一起就好了
有哪些开源模型能实现。硬件应该不是问题。
842 次点击
所在节点    问与答
2 条回复
zapper
246 天前
可以肯定是可以,只是光朗读又不是什么高难度动作,感觉有点多此一举
love060701
246 天前
1 、录制一段你的正面半身视频,可以有手势但不能挡脸,可以全程闭嘴不说话;

2 、使用 GPT-SoVITS 克隆声音(开源,但是有吞字的情况);或者选火山、阿里云、微软的付费语音克隆;输入文字即可生成语音;

3 、使用 wav2lip ,把 1 的视频和 2 的语音合起来,同步嘴型; wav2lip 有很多改良版,需要挑选;

付费服务选 HeyGen ,全套解决。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1026169

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX