文案切片,合成音轨
GPT 生成分镜
DALL-E3 素材绘制
一切就绪,准备生成视频
视频生成完毕
![]() |
1
chanssl 2024-03-04 08:18:21 +08:00 via Android
现在抖音那些小说推文就差不多是这种流水线生产的
|
2
Rache1 2024-03-04 09:02:41 +08:00
类似的早就有了……,之前在 B 站都看到过,文案像是 GPT 生成,然后改改,配音用的 AI ,画面里面全是爬虫根据关键字抓的匹配的,加上过渡动画。
|
3
luckybigbear 2024-03-04 09:34:04 +08:00
期待后续更新,相信这里提升产出效率和准确性是一种创新,作为商业化产品的转变
存在过并不代表没有市场,人为干预的降低、明显的效率提升、画面及准确度的提升,都可以是在红海里杀出的利器 期待后续更新 |
![]() |
4
maymay5 OP @Rache1 那是要人工干预和剪辑的,剪映自带这个功能,但是他们最大的缺陷就是吃不下长文本,我解决了长文本的问题 ,和一站式全自动解决方案 :-)
|
6
ZnductR0MjHvjRQ3 2024-03-04 14:13:13 +08:00
@maymay5 问题是你这个长文分镜如何解决掉主角不一致以及上下文理解呢
|
![]() |
7
maymay5 OP @Motorola3 目前没有解决这个问题,但是我在 [创意工坊] 中解决了这个问题,不用 DALL-E3 直接生成,以插件形式让 GPT4 调用,这样大语言模型就会继承历史记录的描述,当然缺点也很明显,token 消耗几何倍数增长
|
9
ZnductR0MjHvjRQ3 2024-03-04 14:35:17 +08:00
@maymay5 对啊 我之前就实践过这个问题了 几乎是误解的 除非 gpt 支持 lora 但是显然目前没有
|
![]() |
10
maymay5 OP @Motorola3 其实 Plus 会员的做法就是以插件形式调用 DALL-E3 的,虽然上下文中的角色绘制会出现差异,但是基本能保持一致的画风,我其实并不期望 GPT 生成的营销视频有很高的质量,而是能保证一些基础元素能成功合成,毕竟现在的短视频,素材也不见得很衔接
|
![]() |
11
maymay5 OP @luckybigbear 谢谢,没那么大野心哈哈,但是会保持更新
|
12
adorehb 2024-03-04 19:53:00 +08:00
无法注册账号
|