每年两届的 Comiket 上除了传统观念上的同人本外,还有一些偏学术研究性质的同人调查报告、论文发售,其中比较有知名度的是《声优统计》这个同人论文集,这里面的高学历高文化声豚将声优的各种公开行动,转换成数据以数理统计方法来进行观测与预测。而在今年的 C92 上有来自中国的技术团队在现场发表关于利用 AI 创造动画角色的论文,并且还开设了一个利用该技术制作的自动生成角色形象的网站。
这个技术宅团队的成员来自上海同济大学、上海复旦大学、美国卡内基梅隆大学(母校为武汉大学)等知名学府,团队成员有人已经是 ebay 的软件工程师,该团队使用的是喜闻乐见的 Chainer 框架,团队使用的技术简单来说是从 Getchu 网站上大量抓取日本 galgame 游戏的角色图片,总计收集到了 42000 张的日本 galgame 游戏角色的脸部图片,之后在利用相关技术将抓取到的图片按照相对应的属性进行分类统计,例如微笑、长发、双马尾等等。再在这些图片数据的基础上构建出生成式对抗网络模型,让机器进行深度学习,之后可以让用户自己选择自己喜欢的角色属性,由机器自动生成一个二次元的萌妹子形象。该团队配合论文在 C92 的发表开设了一个「 make.girls.moe 」 的网站让用户亲身体验通过深度学习的 AI 根据你的需求自动创建满足你属性喜好的角色形象。
在网站实际生成的图像中,同样是黑长直属性,机器生成的不戴眼镜的妹子图像质量更好
就网站实际生成的头像效果而言,如果添加的要素比较多的话,机器生成的角色形象在图像方面是有明显错位感(其实也可以理解,属性越多机器进行的思考与配对组合越多),虽然团队说明可以将这些机器生成的角色形象作为自己的 twitter 头像,但生成图像在质量方面还有改进的空间。虽然这项技术还远没有成熟到让大家随便丢个属性进去就能出现一个完美的角色形象,但是对于写手、画手来说这种 AI 生成的角色形象可以用来作为创作参考,例如将构思的角色属性丢到 AI 里由 AI 生成一个大致的形象,人类创作者再根据 AI 生成的粗略形象进行更具体的创作。之前日本的团队制作的通过深度学习让 AI 自动为人类绘制的线稿上色的服务,这种 AI 自动上色、自动创造形象的服务,在中短期来说都将成为创作者进行创作的辅助工具,至于在更长远的未来能否实现取代人类,那还要看技术的发展。
另外就是这个网站的使用需要一定耐心,尤其是第一次打开网站的话需要等待加载 16 M 的文件。
make.girls.moe 网站 http://make.girls.moe/
技术论文地址 http://make.girls.moe/technical_report.pdf
项目 github 地址 https://github.com/makegirlsmoe
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.