NVIDIA 与悉尼科技大学提出：生成图像加入训练，助力行人重识别

2019-05-09 09:42:16 +08:00

layumi

小弟的一个工作,欢迎点视频 Demo 来看。代码肯定会开源，但是需要和公司商量一下，可能 2-3 个月。 [ CVPR19 Oral ] Joint Discriminative and Generative Learning for Person Re-identification, Zhedong Zheng, Xiaodong Yang, Zhiding Yu, Liang Zheng, Yi Yang, Jan Kautz

Paper: https://arxiv.org/abs/1904.07223

B 站视频备份： https://www.bilibili.com/video/av51439240/ 腾讯视频备份： https://v.qq.com/x/page/t0867x53ady.html

2489 次点击

所在节点

分享发现

12 条回复

rayhy

2019-05-09 09:58:29 +08:00

我也是做行人图片合成的，前两天看到您的论文震惊了好久...

我目前任务是给人换姿势，PG2 那系列的。不知道楼主觉得您做的东西可能往这个方向发展吗？比如继续从结构特征分离出姿势来？或者训练时模仿你的做法，也交换 ID 生成同 Pose 图片？

另外 CPVR Oral 级别的论文应该不怎么需要推广就一堆人 follow 的吧。

dinghow

2019-05-09 10:07:39 +08:00

惊，CVPR Oral 也需要推广了(lol ），前排支持一下

tycallen

2019-05-09 10:33:20 +08:00

关注

xiangchen2011

2019-05-09 11:22:55 +08:00

厉害了，膜拜下

SeaRecluse

2019-05-09 11:33:26 +08:00

当初学习入门 NLP 的时候知道的大佬，现在专心 CV 了吗

Showfom

2019-05-09 12:49:07 +08:00

额除了一个老外都是中国人啊牛逼

sunxia

2019-05-10 11:00:30 +08:00

支持支持支持

layumi

2019-05-10 13:36:34 +08:00

@SeaRecluse 之前想尝试 nlp。。。其实我也就一篇 nlp 相关的文章，，

layumi

2019-05-10 13:36:58 +08:00

@Showfom 那个是 nvidia research 的大老板。。德国人。。

layumi

2019-05-10 13:40:59 +08:00

@rayhy 我觉得 human parsing 可能比纯 structure 更靠谱。其实我这里的边缘处理还是有颜色不连续。另外你仔细看原始的 jpg 训练数据，也有边缘的问题。如果从 jpg 转到 png 会好一点（扯得有点远了）。所以用 dense 的 parsing 可能会好。题外话，我今年签证被卡了，也不知道能不能去成。。当时 cyclegan 也是 Efros 老板站台宣传的，感觉宣传还是有必要的。

dalieba

2019-05-10 18:43:03 +08:00

那就看将来的大客户是谁了

layumi

2019-07-01 13:34:58 +08:00

代码开源了。Github 地址是 https://github.com/NVlabs/DG-Net

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/562396

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.