一个 22 万张 NSFW 图片的鉴黄数据集?你可以有大胆的想法了……

2019-01-14 14:35:26 +08:00
 ljspython
如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 做一些大胆的新想法,那么数据集是必不可少的。例如图像鉴黄,我们需要使用卷积神经网络训练一个分类器,以区分正常图像与限制级图像。但限制级的图像很难收集,也很少会开源。因此最近有开发者在 GitHub 上开源了一份 NSFW 图像数据集,这是不是你们想要的?



项目地址: https://github.com/alexkimxyz/nsfw_data_scrapper

最后,希望大家注意身体
25129 次点击
所在节点    分享发现
129 条回复
exciting
2019-01-14 21:48:07 +08:00
1024
咦,不好意思走错站了。
i945
2019-01-14 21:51:29 +08:00
我感觉... 这个真训练出来,没几张图能过审
Mrlgm
2019-01-14 22:21:10 +08:00
这谁顶得住呀
Nick2VIPUser
2019-01-14 22:57:10 +08:00
fly9006
2019-01-14 23:16:35 +08:00
额,这样玩下去,gayhub💊
xxgirl2
2019-01-15 01:15:11 +08:00
记得把下载脚本里的 wget 改用 aria2c,要不然那是真的慢(
xuanbg
2019-01-15 07:24:05 +08:00
自然风光图片不错
imn1
2019-01-15 07:52:12 +08:00
自从有电脑开始就不缺这种数据,而且是已经标注了的……
leopku
2019-01-15 08:09:03 +08:00
leopku
2019-01-15 08:12:25 +08:00
@imn1 不分享说个猫线
imn1
2019-01-15 08:20:22 +08:00
@leopku
我只是想说,搞技术的,甚至仅仅只是会用现成工具的,22w 都只是小数目

而且,在这点上我比较相信人民警察的能力,自己拿没事,分享则要慎重
lyseky
2019-01-15 08:21:08 +08:00
收藏不看系列
fengc
2019-01-15 08:26:13 +08:00
flashrick
2019-01-15 09:01:35 +08:00
这谁顶得住啊
DRcoding
2019-01-15 09:07:15 +08:00
7129 次点击 ∙ 263 人收藏 ∙ 5 人感谢

热爱学习的我觉定让它变成 264 人收藏
hasbug
2019-01-15 09:21:35 +08:00
翻看了一些,都是欧美,也没看到真漏的,失望,还不如 sex 站直接看
huruwo
2019-01-15 09:26:06 +08:00
fork 就完事了
Tourin
2019-01-15 09:33:34 +08:00
已 star
Rizio
2019-01-15 09:33:58 +08:00
@heiyutian 说起来有点下流,我。。我好了
Rizio
2019-01-15 09:34:35 +08:00
@hasbug 就是要这种没漏的,留给自己 YY 的空间,嘿嘿嘿嘿

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/526896

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX