一个 22 万张 NSFW 图片的鉴黄数据集?你可以有大胆的想法了……

2019-01-14 14:35:26 +08:00
 ljspython
如果你想训练一个内容审核系统过滤不合适的信息,或用 GAN 做一些大胆的新想法,那么数据集是必不可少的。例如图像鉴黄,我们需要使用卷积神经网络训练一个分类器,以区分正常图像与限制级图像。但限制级的图像很难收集,也很少会开源。因此最近有开发者在 GitHub 上开源了一份 NSFW 图像数据集,这是不是你们想要的?



项目地址: https://github.com/alexkimxyz/nsfw_data_scrapper

最后,希望大家注意身体
24941 次点击
所在节点    分享发现
129 条回复
BestMe
2019-01-14 15:59:20 +08:00
@ljspython 不懂技术的,表示很焦急。
wwg1994
2019-01-14 16:01:49 +08:00
这谁顶得住啊
shench
2019-01-14 16:08:34 +08:00
厉害厉害!
abeholder
2019-01-14 16:08:45 +08:00
哇塞,搭配我的控制台下载器
https://github.com/abedormancy/tinydownloader
来下载 食用更佳 (里面有千把张二次元桌面壁纸,忘记哪爬的了。。)~~
imshf
2019-01-14 16:09:59 +08:00
@thonatos #13 顶得住老哥
zhang1215
2019-01-14 16:10:58 +08:00
@JohnChiu 噢,没仔细看还以为全都是呢
abeholder
2019-01-14 16:12:27 +08:00
为什么突然萌生出一种六学既视感 。。。

说到 NSFW 的数据集, 我就想起了几个月前做的一个小的下载器。。。

别问了,问就文体两开花·
lingo
2019-01-14 16:15:35 +08:00
你要说人工智能神经网络,我是不会的,但是你说人工标注,那我们的故事就开始了。
lingo
2019-01-14 16:17:20 +08:00
顺便想起前几天看到的说 firefox 新功能,内置了一个黄网名单,名单上的网站不会出现在欢迎页。。
作为一个开源项目,能不能只对这份名单感兴趣 = =
d5
2019-01-14 16:21:10 +08:00
理念先进了
gxlwm
2019-01-14 16:21:44 +08:00
就这一会 star 涨了好多, 老哥们稳
Amayadream
2019-01-14 16:22:50 +08:00
这谁顶得住啊
lucahan
2019-01-14 16:26:07 +08:00
@abeholder 这谁顶得住啊。。。
xspippo
2019-01-14 16:33:48 +08:00
快拿我的营养快线
jasonyang9
2019-01-14 16:37:53 +08:00
这叫学以致用
Bantes
2019-01-14 16:39:50 +08:00
1842 次点击 ∙ 55 人收藏
不说了,收藏波先
suyuyu
2019-01-14 16:44:22 +08:00
插眼
x86
2019-01-14 16:49:34 +08:00
手冲一时爽,一直冲一直爽
lkmountain
2019-01-14 16:51:10 +08:00
插眼
youngxu
2019-01-14 16:52:48 +08:00
机器之心昨天发的,我昨天就 clone 了以防被删( x

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/526896

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX