一个 22 万张 NSFW 图片的鉴黄数据集?你可以有大胆的想法了……

2019-01-14 14:35:26 +08:00
 ljspython
如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 做一些大胆的新想法,那么数据集是必不可少的。例如图像鉴黄,我们需要使用卷积神经网络训练一个分类器,以区分正常图像与限制级图像。但限制级的图像很难收集,也很少会开源。因此最近有开发者在 GitHub 上开源了一份 NSFW 图像数据集,这是不是你们想要的?



项目地址: https://github.com/alexkimxyz/nsfw_data_scrapper

最后,希望大家注意身体
24938 次点击
所在节点    分享发现
129 条回复
lwlipuyang
2019-01-14 14:46:58 +08:00
我佛了
hilbertz
2019-01-14 14:47:52 +08:00
好的,先让我再进行一次详细的人工标注
publicvoid
2019-01-14 14:54:30 +08:00
楼主好人
DesmondLiu90
2019-01-14 14:55:05 +08:00
666
zhang1215
2019-01-14 15:11:01 +08:00
刚刚随意打开一张发现并不是 NSFW 的 http://cdn.awwni.me/kguv.jpg
lucahan
2019-01-14 15:12:09 +08:00
有点强啊。。。。
likuku
2019-01-14 15:12:44 +08:00
@zhang1215 可能...有些办公室的也是无法容忍(正常)二次元文化吧。
Oa
2019-01-14 15:13:03 +08:00
删前留名
wsd15321
2019-01-14 15:18:38 +08:00
这也行
ziseyinzi
2019-01-14 15:20:34 +08:00
收藏比回复多系列
JohnChiu
2019-01-14 15:22:58 +08:00
@zhang1215 #5 neutral 和 drawings 文件夹内是 safe for work 的啊
HOHOCCC
2019-01-14 15:25:51 +08:00
这谁顶得住啊
thonatos
2019-01-14 15:26:57 +08:00
要不要拿出我私藏的爬虫出来?怕分享了大家身体就垮了
hpeng
2019-01-14 15:28:20 +08:00
Reddit 去采集 nsfw 就好了,已经帮你标注了
slamDunkLINk
2019-01-14 15:37:16 +08:00
楼上的,有就别私藏了,分享才是王道
kawkeye
2019-01-14 15:39:12 +08:00
@thonatos share?
sxm
2019-01-14 15:47:50 +08:00
抓个 xxx 站就有几百万的图了
zhuoyan
2019-01-14 15:48:53 +08:00
1042 次点击, 25 人收藏
lucahan
2019-01-14 15:53:56 +08:00
@thonatos 我能顶得住
stone666
2019-01-14 15:57:00 +08:00
火钳刘明

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/526896

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX