新查询系统上线,可查询所有泄漏网站共63999511条记录,全文搜索,支持正则,典型匹配时间在4秒以内,欢迎试用。

2011-12-25 00:13:14 +08:00
 dndx
地址在这: http://leaks.idndx.com:8000/

感谢 http://www.v2ex.com/member/Showfom 提供主机。
5921 次点击
所在节点    信息安全
56 条回复
vibbow
2011-12-25 00:17:21 +08:00
不是8千多W条么?
dndx
2011-12-25 00:18:20 +08:00
@vibbow 就找到这么多……8千万条从哪来的
vibbow
2011-12-25 00:20:04 +08:00
@dndx 17173还有1.3G的数据
vibbow
2011-12-25 00:20:18 +08:00
@dndx 稍等我统计下我的总数....
vibbow
2011-12-25 00:23:50 +08:00
我的数据库里总共有 85359069 条数据...
frittle
2011-12-25 00:26:23 +08:00
速度快。
vibbow
2011-12-25 00:28:12 +08:00
不过很好奇你的算法。
我是把文件切割成200M,然后一个一个的以此读到内存里搜索指定的关键字。
全部搜索一遍得3分钟。

不知道你是怎么做到的那么快...
vibbow
2011-12-25 00:29:48 +08:00
哦,对了。我是用PHP @ Windows做的,所以效率肯定比Linux下要慢。
不过你这个是挺快的。
vibbow
2011-12-25 00:32:50 +08:00
我也试过MySQL全文搜索。光csdn表的话,用我的算法是20多秒,用MySQL建立全文索引后是10秒。
可是尼玛8千多万条数据,建立全文索引估计都得一两天...
lepture
2011-12-25 00:45:30 +08:00
我终于也中枪了。 7k7k,看来是百度的。
delectate
2011-12-25 00:47:41 +08:00
7k7k到底是多少好基友合体啊》?!
dndx
2011-12-25 00:50:00 +08:00
@vibbow 明天再加数据,能不能提供一些17173的下载地址?谢谢!
有时间写篇文章说说查询原理,敬请期待。
vibbow
2011-12-25 00:52:05 +08:00
17173的网上不好下。你留个邮箱或者QQ,我发给你我服务器FTP地址,你自己挂吧。
服务器上传很慢,预计得挂四五个小时,400M
icyflash
2011-12-25 00:52:19 +08:00
CSDN 2004年用户没中枪。。。
vibbow
2011-12-25 00:54:07 +08:00
这个数据库肯定只是部分,没中枪不代表没泄漏...
lostab
2011-12-25 01:04:40 +08:00
可以肯定7k7k是百度的账户,狗日的百度。
vibbow
2011-12-25 01:07:06 +08:00
蛋疼了,我试着搜索了一个 "a"
然后5分钟没结果了...
underone
2011-12-25 01:07:45 +08:00
7K7K中枪...
smallcolor
2011-12-25 01:09:27 +08:00
@dndx 能否隐藏掉密码的部分?不然大家都能很方便地互相看啦。
delectate
2011-12-25 01:09:41 +08:00
@vibbow ,delectate@gmail.com
谢谢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/24248

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX