密码泄漏搜索工具

2011-12-23 02:45:36 +08:00
 vibbow
密码泄漏搜索工具,用于在5个已泄漏的数据库里综合搜索数据。

目前已经支持的5个数据库:CSDN, 7k7k, 人人, 嘟嘟牛, 多玩。虽然网上能下到猫扑的数据,但是实际压缩包是损坏的,所以在这里就先不支持了。

关键字长度要超过6位,同时只接受字母,数字以及点(.),下划线(_),AT(@)。

此工具仅提供7天,7天后关闭提交。如果还有未完成的搜索则等待搜索完成后彻底关闭。

http://vsean.net/blog/post/98
4956 次点击
所在节点    分享发现
33 条回复
evlos
2011-12-23 02:59:05 +08:00
。。。关键字要6位 。。。。我账号才5位。。。。
vibbow
2011-12-23 03:02:35 +08:00
@evlos 好吧,那我修改成5位的,不过应该不能再少了...
vibbow
2011-12-23 03:20:48 +08:00
补充说明:不知道由于什么原因,我自己测试往QQ邮箱发信收不到,因此大家尽量用国外的邮箱收信吧。
vibbow
2011-12-23 05:33:29 +08:00
我了个去,发现一个严峻的问题:现在性能瓶颈居然不是硬盘,而是CPU...
vibbow
2011-12-23 06:00:23 +08:00
因为修改代码时失误,导致给8位用户(应该都是v2ex的吧)发送了一封垃圾邮件,在此表示抱歉。
carry
2011-12-23 10:16:16 +08:00
大恩不言谢 创意主很精通搜索吗
vibbow
2011-12-23 10:37:39 +08:00
@carry 完全不精通搜索,服务端都是用PHP写的,先全部转小写然后用strstr比较... 要不然效率也不至于这么低了...
vibbow
2011-12-23 17:42:17 +08:00
哈,用Process Explorer看了下服务器的运行状况,硬盘今天爽high了~
vibbow
2011-12-23 17:48:47 +08:00
delectate
2011-12-23 18:43:38 +08:00
win的服务器?这么大的数据库,还是grep等给力,既支持正则,速度又快。
vibbow
2011-12-23 18:53:00 +08:00
@delectate 目前还在优化算法... 已经降低了1分钟用时了。全当学习了~
vibbow
2011-12-23 19:07:13 +08:00
擦...服务器开始自动备份了...速度瞬间降低...
vibbow
2011-12-23 19:30:38 +08:00
怎么优化都是4分钟,应该是到strstr函数的极限了...
delectate
2011-12-23 19:47:31 +08:00
瓶颈。想想顺序读取1g的数据还要很久时间呢。
vibbow
2011-12-23 19:50:08 +08:00
@delectate 现在的硬盘连续读取应该都在80M/s以上了吧... 大约30秒就能把2G文件遍历一遍...
delectate
2011-12-23 20:09:19 +08:00
只是那很轻松的,问题是还要匹配。正则的引擎差一点就慢很多。反正不大,都放内存里速度能加倍;或者优化一下数据库,别简单的 cat *> database就拿去用……
vibbow
2011-12-23 21:52:43 +08:00
因为国内的服务器在搜索完成后回调国外的服务器失败(这个时段,你懂的…),所以之前给一些用户发送了可能错误的“搜索结果为空”email。因为我也不确定具体什么时间开始失败的,所以我按照缓存的记录,给之前所有搜索结果为空的用户重新搜索并且发送了邮件。
在此对再次收到我“垃圾邮件”的用户表示抱歉。
vibbow
2011-12-24 05:31:57 +08:00
继续优化了代码,全文搜索时间从4分多钟降到了2分钟,同时添加上了mop的库(虽然感觉这个库很奇怪,很假...)
liruqi
2011-12-24 08:54:56 +08:00
直接导入到 mongodb 或者 mysql 加索引啊。为啥要自己写查询呢。
delectate
2011-12-24 09:26:57 +08:00
@vibbow ,哇,求~~我下的都是损坏的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/24111

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX