空手套图术~

2018-01-24 14:14:31 +08:00
 xwhxbg

上次请教了大家关于平胸妹子鉴黄的问题,调整了一下训练数据集之后又练了个模型 120.78.173.99:4000/tryout 这里可以体验一下,手机端和 PC 端访问都做了适配,后续等我把代码整理一下就丢 gayhub 上了(由于是二手 py,所以会比较丑)

同时收一波训练素材:doge

11620 次点击
所在节点    分享创造
69 条回复
Weny
2018-01-24 16:20:43 +08:00
@taurenshaman 真的怕
kenshinhu
2018-01-24 16:23:44 +08:00
服务器好像不能访问了?
gamexg
2018-01-24 16:26:44 +08:00
没填 url 就点了提交,然后就打不开了...
xwhxbg
2018-01-24 16:29:01 +08:00
@Weny 1 核 1G 扛不住啊,跑这个已经占了一半内存了
@kenshinhu 我这边恢复了,刚才触发了个 bug 导致进程 hang 住了
@gamexg 现在应该好了
skyrem
2018-01-24 16:31:35 +08:00
google 搜 GAY 然后贴上的基本都 NSFW
zo
2018-01-24 16:37:36 +08:00
这就直接开车了。。。
zst
2018-01-24 16:39:52 +08:00
其实我想说有些我自己都不知道算不算小黄图
mcone
2018-01-24 16:42:17 +08:00
啊 看到楼主头像我就想到你之前那个剑皇帖子了 果然还是你哈哈 随手找了几个关键词搜了十几张图丢了上去 感觉比我想象的好不少……哈哈
话说这个结果不太像是用 3k 样本训练出来的。。。能大概透露下训练样本数和方法吗,直接用已训练好的模型,finetune 一下?难道是直接训练出来的吗(惊恐)
不过有一些 NSFW 本身就涵盖过的图片类别在你这里反而结果有点奇怪 感觉你应该微调了啥……
xwhxbg
2018-01-24 16:52:01 +08:00
@mcone 确实只有 3K,用的 nn.softmax,数据处理参考的 open-nsfw,它有个方法用来处理数据矩阵的,然而由于我数学渣渣,看不懂为啥要这么做,目前感觉可能是样本太少导致很多图的结果很奇怪,多人图,身体局部图都很奇怪
kingcc
2018-01-24 16:53:47 +08:00
火钳刘明
jarnanchen
2018-01-24 17:07:56 +08:00
给楼主 贡献了几张大胸肌肉男,NSFW 0.48 算不算黄啊
Travers
2018-01-24 17:15:14 +08:00
传了个 22600082070.jpg ,才 0.09 ,楼主可以看下
Travers
2018-01-24 17:17:35 +08:00
还有个 22600082078.jpg NSFW 0.078 问题比较大
R18
2018-01-24 17:17:37 +08:00
老哥有源码了求艾特
mcone
2018-01-24 17:24:50 +08:00
@xwhxbg 完全自己训练的吗……那这个结果其实已经不错了 才 3k 数据量要啥自行车(哈哈哈哈) 不过通常 nn.softmax 用于多类 你的样本太少了 有空的话可以改 sigmod 试试看

那个处理数据矩阵的方法我不太清楚,回头等你开源了我围观下吧,毕竟不是做黄图的对这块还真是不太了解……
至于我上条回复提到的类别的是 athlete,可能你的训练样本里不够多,很多露肉运动员被搞成了黄图……但是我不确定直接加一些类似样本会不会有帮助,因为你数据太少了,加的多了反而可能对你模型有负效果……
xwhxbg
2018-01-24 17:34:24 +08:00
@mcone Will do,现在主要是我没有理论支撑,单纯靠调参或者调方法可能不能达到一个可行的高度,而且 py 的性能问题也很突出,目前想要把训练好的模型用 golang 的 TensorFlow binding 来调用,不知道会不会有明显的区别

athlete 这个问题其实蛮严重的,我看了下我收到的结果波动很大,有些 NSFW 被打的很高,有些很低,跟我预想的能节约 90%以上的人力成本差的很有点远,目前看来能节约 50%就不错了

目前在看 https://www.coursera.org/learn/machine-learning 这个课程想要补一下入门知识,现在只恨时间太少,白天还要搬砖,搞完不知猴年马月了
xwhxbg
2018-01-24 17:35:05 +08:00
@Travers 好的,我等下班了会把分类的图和标签都下下来分析一下的
gh110827
2018-01-24 17:36:53 +08:00
楼主,我这有个接口,大概是 6000 多张图,都是煎蛋上的,你可已用来当素材训练
https://ie34.com/api/jiandan
AckywOw
2018-01-24 17:58:56 +08:00
老司机带带偶🤓
owlsec
2018-01-24 18:11:48 +08:00
流弊

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/425543

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX