V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
coolwulf
V2EX  ›  问与答

[原创] 女儿的学校照片 + 吐槽收费的要价 + 人工智能的解决方法

  •  
  •   coolwulf · 2018-10-24 05:07:18 +08:00 · 4129 次点击
    这是一个创建于 1132 天前的主题,其中的信息可能已经有所发展或是发生改变。

    又到了一年一度的学校 school picture 时节, 在北美这里有孩子的朋友可能知道, 一般这个时间就是家长得出(tu)钱(xie)的时候了。一般的 school picture 的要价是这样的:

    http://thyrsi.com/t6/394/1540328645x-1566684341.jpg

    这往往是便宜的,而且一般你家孩子不会只照一张俩张,有时候还会有和其他同学的合照和班级集体照。

    随口问了孩子妈,“我们今年买几张”。“全要吧”, 孩子妈头也不回的说。

    我简单一算,哎呀妈呀,这还不得好几大百 $ 下去了...

    有没有更好的解决方法?然后我想到了 AI, 想到了我那一堆躺在地下室吃灰的显卡 ... (前情提要请看我前面的帖子)

    首先我研究了一下 School Picture 提供网站上面提供的学生样品图片。这些样品图片一般是低解析度 (Low Resolution) 和加上了水印 (Watermark) 的给用户提供一个购买之前照片印象的图片。

    看了看这些图片,让我想到了使用 SRGANs 和其他的 In Painting Network 来解决这个问题的可能。好吧说干就干吧

    首先是原图: http://thyrsi.com/t6/394/1540328673x-1404814676.jpg

    使用 ImageNet 的数据,通过 SRGANs 来训练一个 AI 来提升图片的 resolution, 网络结构:

    这个网络大概训练了三天多,我看结果似乎还不错,够用了

    提升后的图片解析度达到了打印成 8 x 10 或者更大片副的要求,这里是 100% 的 before / after 比较: http://thyrsi.com/t6/394/1540328695x-1404814676.jpg

    接下来的问题是水印,我采用了 Nvidia 团队支持不同大小,形状的 Partial Convolution 的解决方法, 论文: http://thyrsi.com/t6/394/1540328723x1822611687.jpg

    训练的数据主要是 ImageNet 中的人物数据集,然后我又加上了 CelebA 这个专门的名人头像数据集来作训练

    总过花了快俩周的时间才 train 完 (汗,太慢了)。这个 AI 的结果还凑合,暂时可以用了,放一下结果图:

    http://thyrsi.com/t6/394/1540328739x1822611687.jpg

    当然结果还不够好,可能还需要手工做些 touchup. 不过我打算在继续强化一下这个网络,看看能否提高效果。

    然后准备写个简单的网站,这样方便远程使用,年底再去坐 Cruise 的时候看来是不需要再花大价钱买照片了...

    哈哈哈...

    当我正准备狂笑三声的时候,孩子妈劈头盖脸的问我 "孩子照片你不是说上周就挂家墙上的嘛?“, 我:"..."

    25 条回复    2018-10-24 20:56:25 +08:00
    klaksvik
        1
    klaksvik   2018-10-24 06:21:33 +08:00 via Android
    哈哈,楼主这个太赞了。
    green15
        2
    green15   2018-10-24 07:09:19 +08:00 via iPhone
    楼主的思路奇特,技术含量高……收徒弟吗? 23333
    xenme
        3
    xenme   2018-10-24 07:10:56 +08:00 via iPhone
    这结尾,😄
    DevRoss
        4
    DevRoss   2018-10-24 07:28:27 +08:00 via Android
    哈哈哈
    bearqq
        5
    bearqq   2018-10-24 07:29:40 +08:00 via Android
    拿女儿照片来骗点击量也是蛮拼的
    (滑稽
    OscarUsingChen
        6
    OscarUsingChen   2018-10-24 07:56:53 +08:00
    leoojiang
        7
    leoojiang   2018-10-24 08:04:44 +08:00 via iPhone
    考虑到一个问题:涉不涉及版权……
    coolwulf
        8
    coolwulf   2018-10-24 08:41:38 +08:00
    @OscarUsingChen 或许是的,不过我之所以训练这个网络不仅仅是为了去除 watermark, 还可以针对 loss information 的图片来做修复,对于有损伤的老照片之类的也可以使用。
    coolwulf
        9
    coolwulf   2018-10-24 08:48:46 +08:00
    确实,这个模型可以有其他的应用。
    Bryan0Z
        10
    Bryan0Z   2018-10-24 08:50:04 +08:00 via Android
    你这个好便宜,我们拍的毕业照,一张要 90 刀,最后听说是没人买
    harry890829
        11
    harry890829   2018-10-24 09:01:24 +08:00
    说起来,这样的话马赛克是否也……
    silencefent
        12
    silencefent   2018-10-24 09:07:36 +08:00
    在中国打印然后寄过去比美帝便宜
    sfree2005
        13
    sfree2005   2018-10-24 09:20:59 +08:00
    技术上佩服,但这涉及版权问题吧。如果对技术真的很感兴趣,大可用没有版权的图片,或者你已经购买了版权的图片玩玩。
    jetyang
        14
    jetyang   2018-10-24 09:50:33 +08:00
    孩子脸颊和下巴上还是可以看到很深的字母印记,还要继续加强
    SCaffrey
        15
    SCaffrey   2018-10-24 10:41:31 +08:00 via Android
    好厉害 Qrz
    可以考虑尝试更强大的 SR 网络(?)
    takato
        16
    takato   2018-10-24 10:48:32 +08:00
    那么重新 GAN 一个到底涉及版权吗?
    其实很难界定的,毕竟自然的物都遵循某种规则,而这种规则有版权吗?个人认为显然没有吧。。
    alexapollo
        17
    alexapollo   2018-10-24 10:49:54 +08:00
    @SCaffrey SRGAN 目前已经不错了
    tutustream
        18
    tutustream   2018-10-24 11:00:54 +08:00
    哈哈,LZ 在训练 AI 用 PS 么。
    bestkayle
        19
    bestkayle   2018-10-24 11:04:41 +08:00
    有个疑问,不能自己拍吗
    artandlol
        20
    artandlol   2018-10-24 11:31:36 +08:00
    amon
        21
    amon   2018-10-24 11:39:14 +08:00
    目的是去水印么?貌似有一些成熟的产品。
    dapp98230
        23
    dapp98230   2018-10-24 19:09:07 +08:00
    nb
    coolwulf
        24
    coolwulf   2018-10-24 20:56:00 +08:00
    @amon 训练这个网络的目的不仅仅是去水印,还可以 recover loss information, 可以用来修复旧照片等等. 水印如果有 ps layer, 确实不需要这种方法还去除。但很多时候的水印照片是没有 layer 的,比如你自己翻拍的,或是商家移除了图层的,这时候, deep learning 的智能填充才可以做到
    coolwulf
        25
    coolwulf   2018-10-24 20:56:25 +08:00
    @artandlol 你这个需要图片包含图层信息.
    关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2687 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 12:40 · PVG 20:40 · LAX 04:40 · JFK 07:40
    ♥ Do have faith in what you're doing.