9000w 条真实数据开放了

2015-12-24 10:04:28 +08:00
 nowcoder

奖金 3w+ 奖金 3w+ 奖金 3w+
大数据比赛开始啦,真实 9000w 条用户数据开放下载,极具实验研究价值,戳⬇️
http://www.nowcoder.com/activity/calendar

7611 次点击
所在节点    程序员
27 条回复
young
2015-12-24 13:25:52 +08:00
jiezhi
2015-12-24 13:38:50 +08:00
虽然没搞过这个,先把数据拿下来备用:-D
a40049
2015-12-24 15:57:12 +08:00
虽然想报名,但是看到必须填写手机号,还是算了
SourceMan
2015-12-24 16:09:12 +08:00
V2ex 可以通过遍历用户 ID 拿到用户的信息, L 大真是不为我们的“隐私”着想!!!
23333~
s7lx
2015-12-24 16:19:20 +08:00
只要数据不想参加比赛的可以看这里 http://pan.baidu.com/s/1bobAO9L 密码 ste5
billwang
2015-12-24 22:09:55 +08:00
中华万年历——记住了,以后再也不用。
meantobe
2015-12-24 22:35:34 +08:00
2006 年 8 月, AOL 出于好意而公开了一大批查询日志样本,供人研究。这些日志涉及三个多月以来 65 万用户的 2000 万查询,已经做了匿名处理,因此从理论上讲,不存在任何可以用于辨识个人身份的信息。尽管是善意之举,但人们也很快就发现这些日志在实践中不会像 AOL 想象的那样做到完全匿名。每个用户在查询时都会被赋予一个随机但唯一的标识符,有了这个标识符,就很容易知道同一个人都查询过什么内
容。进而,确定一些人的身份也就成为可能。因为不少人都搜索过自己名字、地址、社会保险号以及其他个人信息,通过搜索相关性分析暴露出来的信息比 AOL 认为的多,也肯定比原始用户自己想到的多得多。 AOL 很快从自己网站上删除了这些日志,当然为时已晚。这些数据早已被传播得满世界都是了,而且至今仍可以找到,甚至还附有帮你分析它们的一些工具。
—— Brian W. Kernighan 《世界是数字的》

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/245770

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX