能否用 AI 来生成自己的视频和声音代替自己出镜/录视频？

340 天前

1014982466

苦于作业太多，而且都是让自己录制非实时，每个 Presentation 作业都要半个小时，但其实重点是 Slides ，自己出镜就是读稿子
假设用自己的数据训练，能否训练出自己的声音+面容，让它帮我朗读，我只要自己写稿子就行了，然后把这段视频和 PPT 录制视频嵌在一起就好了
有哪些开源模型能实现。硬件应该不是问题。

931 次点击

所在节点

问与答

2 条回复

zapper

340 天前

可以肯定是可以，只是光朗读又不是什么高难度动作，感觉有点多此一举

love060701

340 天前

1 、录制一段你的正面半身视频，可以有手势但不能挡脸，可以全程闭嘴不说话；

2 、使用 GPT-SoVITS 克隆声音（开源，但是有吞字的情况）；或者选火山、阿里云、微软的付费语音克隆；输入文字即可生成语音；

3 、使用 wav2lip ，把 1 的视频和 2 的语音合起来，同步嘴型； wav2lip 有很多改良版，需要挑选；

付费服务选 HeyGen ，全套解决。

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1026169

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.