基于深度学习的快速视频风格化 - V2EX

Home Sign Up Sign In

爱意满满的作品展示区。

This topic created in 3525 days ago, the information mentioned may be changed or developed.

刚刚接触深度学习，感觉挺好玩的。这个项目简单来说就是对一个视频的每一帧做风格化：

但直接每帧做的话视频抖动会很严重，今年四月份有个算法解决了抖动问题，但很慢。我用了一些技巧提速了 10 倍。(其实理论上有 30 倍，但不知道为什么改了以后 GPU 跑不满 100%，可能瓶颈变成加载了。。。) 这样就能渲染比较长的视频了。样例视频可以看这里：Project Page。如果上不了 YouTube ，可以看我传到 bilibili 的哆啦 A 梦

GitHub 代码： https://github.com/zeruniverse/fast-artistic-videos

18 replies • 2016-12-07 17:14:39 +08:00

1

hackpro

Nov 2, 2016

视频逐帧做肯定不行的太慢了
按理讲用光流已经考虑帧间差分了
建议考虑下视频特性，如果 H.264 的话，找出 I 帧，进行风格变换，然后再考虑 B ， P 帧的预测

2

zzy8200

OP

Nov 2, 2016 via iPhone

@hackpro 当时想过用一个 deep 网络，前帧和本帧以及 flow 作为输入，输出一张稳定的帧。但不知道怎么样的结构可行。逐帧确实还是慢

3

moonkiller

Nov 2, 2016

lz 真赞，今年 prisma 流行的时候，就在想应该可以出个视频版的艺术家滤镜。没想到 lz 这么快就搞出来了
不过看上去效果不太理想：感觉就像是原视频上罩了一层颜色，例如梵高那个，视频里都是黄色斑点

4

hackpro

Nov 2, 2016

@moonkiller 光靠前帧和本帧可能远不够
你最好看下视频编码的原理
希望能帮助到你

5

zzy8200

OP

Nov 2, 2016

@moonkiller 难道梵高的画不是黄色斑点。。。我觉得选个 ice age 什么的视频会明显点吧。

6

zzy8200

OP

Nov 2, 2016

@hackpro 额我知道。 P 层编进去的是 DIFF 。但没想到什么好方法可以快速对 diff 做风格化

7

moonkiller

Nov 2, 2016

@zzy8200 但是黄斑应该是在物体的高光和高亮区出现啊，，，视频里感觉是随机分布的－－，，，

8

fffflyfish

Nov 2, 2016

厉害， lz 我比较关注你说的提速技巧，除了提高学习率的值，还有别的方法吗？ lua 代码不是很懂

9

silencefent

Nov 2, 2016

看上去只是 repeat 了一层纹理吧

10

zzy8200

OP

Nov 2, 2016 via iPhone

1

@fffflyfish 提高学习率会炸的…… 原来的方法是逐帧拿原图和 style 图还有 flow 做优化。我改成拿 style 好的图和 flow 做优化。 style 这一步可以用训练好的网络很快出。

11

fffflyfish

Nov 2, 2016

@zzy8200 原来如此，谢谢

12

lzx1413

Dec 7, 2016

@moonkiller 因为楼主直接用的原版论文的模型，效果就是这样的比较烂，后面加了 instance norm 的版本效果会好一点

13

lzx1413

Dec 7, 2016

@fffflyfish 这个是直接基于论文 Perceptual Losses for Real-Time Style Transfer
and Super-Resolution 做的风格化，当然比原版要快了

14

lzx1413

Dec 7, 2016

@hackpro titanx 直接做 480*640 能到 20ms 一帧，在 Perceptual Losses for Real-Time Style Transfer and Super-Resolution 这种模式下

15

lzx1413

Dec 7, 2016

@moonkiller facebook 手机端都实时了==

16

fffflyfish

Dec 7, 2016

@lzx1413 我大概扫了下论文，原来是李飞飞实验室的，不过文章好像是对单张图片风格化，并没有针对视频吧？

17

lzx1413

Dec 7, 2016

@fffflyfish https://github.com/jcjohnson/fast-neural-style 这是他们的工程。有 webcam ，不过没有做特殊处理，但是速度没问题

18

zzy8200

OP

Dec 7, 2016 via iPhone

@lzx1413 主要工作是修正了抖动。 webcam 还好因为背景抖动不大，但直接图片的方法训练电影很 gg

About · Help · Advertise · Blog · API · FAQ · Solana · 2831 Online Highest 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 45ms · UTC 06:57 · PVG 14:57 · LAX 23:57 · JFK 02:57
♥ Do have faith in what you're doing.