有没有人考虑做密码泄漏中招查询网站?

2011-12-22 15:52:27 +08:00
 dndx
实际上,技术实现也会很蛋疼,只能考虑把4000W条记录全部Cache到Memory里。MySQL、MongoDB神马的基本上没用,因为必然每次都是4000W的全表扫描,网友涌来服务器必宕无疑。

如果有同学能提供8G内存的VPS,这事还比较靠谱。可以来联系我Twitter@dndxdndx

我用Python试了一下,600W条内存记录遍历一次大概需要0.4s,可以忍受。
5635 次点击
所在节点    分享发现
23 条回复
rfwert343
2011-12-22 15:53:46 +08:00
不用直接下载以后看更快
cdh_ys
2011-12-22 15:54:31 +08:00
http://t.easyicon.cn/ 不到0.4s吧
dndx
2011-12-22 15:56:09 +08:00
@cdh_ys E-Mail和用户名都遍历,因为记不住用户名的人是相当多的。
rfwert343
2011-12-22 15:57:16 +08:00
@dndx 你不如直接做个链接网站,电驴分享的,不消耗服务器。
dndx
2011-12-22 15:57:50 +08:00
@cdh_ys 另外这个站用的是精确匹配
比如你叫dndx123,你搜dndx是搜不到的
这样能利用索引,所以速度快
代价是记不清用户名就悲剧了。
rfwert343
2011-12-22 15:59:06 +08:00
@dndx 做个电驴链接分享网站,用discuz论坛就能搭建一个。然后下载都是用户自己下载用户的,你就不用担心服务器耗不起了。
dndx
2011-12-22 16:00:07 +08:00
@dndx 上条纠正,这个站应该是like %xxx% 匹配的
dndx123是能用dndx搜到的。
dndx
2011-12-22 16:01:45 +08:00
@rfwert343 小心跨省啊。
rfwert343
2011-12-22 16:03:02 +08:00
@dndx 你直接做个密码查询网站数据都在你网站上,岂不是更要抓你?
dndx
2011-12-22 16:04:23 +08:00
@rfwert343 但是在显示结果前你可以给密码打码,客观上你并没有传播别人的密码,也就无从跨省了。
rfwert343
2011-12-22 16:06:07 +08:00
@dndx 话是这样说,可是你说哪个更容易被封呢?数据都在你的服务器上呢。
lxklz
2011-12-22 16:36:30 +08:00
http://leak.xpcha.com/csdn/ 这个也很快,但好像只能精确匹配
willerce
2011-12-22 16:55:52 +08:00
多简单的事,放数据库就OK了,分表嘛。
dreamersdw
2011-12-22 17:47:09 +08:00
方法有很多种
1)像 @willere 说的那样放数据库里,加上索引,或者分区。
2)虽然是文件数据,但努力一下也可以像 ctags 那样,实现二分查找。
3)利用文件系统实现查找功能,比如建立多层文件夹表示用户名 /path/s/o/m/e/o/n/e/
CMGS
2011-12-23 00:22:14 +08:00
目前放出来的都是精确匹配,数据入数据库,索引Email和Name……
模糊的……恩有……纯文本grep,下面有提供方案……
http://www.v2ex.com/t/24087#reply15

哈欠……睡觉去……
feiandxs
2011-12-23 00:34:49 +08:00
我一直想知道
xmd5这种站是怎么做到的。。。
billions of key/values....
delectate
2011-12-23 00:34:50 +08:00
文件系统io是瓶颈;grep更快
delectate
2011-12-23 00:35:07 +08:00
grep+正则还可以支持模糊匹配
taby
2011-12-23 01:12:08 +08:00
金山已经出了吧
vibbow
2011-12-23 02:46:52 +08:00
http://vsean.net/blog/post/98 5个数据库全文搜索,搜一次3分钟...

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/24071

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX