小白写了个 Bloomfilter,求指点

2017-06-09 21:31:43 +08:00
 preyta

第一次写了一个完整的小工具,不知道写得怎么样,求各位大大指点一下 Github pybloomfilter

2965 次点击
所在节点    Python
11 条回复
hwding
2017-06-09 22:10:19 +08:00
提个小建议,README 里面,ops 的 ps 已经有每秒的意思,就不需要 /s 了。
preyta
2017-06-09 22:53:10 +08:00
@hwding 恩,谢谢,我这就去改正回来,想问下 ops 是 operation per sec 吗?
EmdeBoas
2017-06-09 23:01:20 +08:00
挺不错的,建议除了可以 save 和 restore 之外 还可以直接在持久化的文件上进行 add 另外 fpp 那个测试还是草率了点,弄点实际的 URL 去测吧...
preyta
2017-06-09 23:06:59 +08:00
@EmdeBoas 恩,这个测试是太草率了点...
Systemd
2017-06-09 23:07:56 +08:00
>>> filter_ = Bloomfilter(1000, 0.001)

# set size of input 1000, error rate 1%

1% 不应该是 0.01 么?
hwding
2017-06-09 23:23:46 +08:00
@preyta 应该是的吧 :)
preyta
2017-06-09 23:24:38 +08:00
@Systemd 嗯嗯,前面写测试的时候手贱了,看得好仔细
waruqi
2017-06-09 23:48:56 +08:00
preyta
2017-06-10 09:26:46 +08:00
@waruqi 前面查资料的时候也有看过你这个博客
prasanta
2017-06-10 16:29:05 +08:00
可以贴一下各项速度和 python 内置的 set 对比图么
preyta
2017-06-10 17:59:22 +08:00
@prasanta 刚才粗略的测试了一下,输入在一亿数量级往下的时候 set 还是快不少的,用不着 bloomfilter,但是当 set 的内存开销达到系统瓶颈时,性能会急剧下降,在我的机器上测试了三亿次插入操作,速度已经降到了 355ops,不过我的机器也就 8G 内存。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/367345

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX