想实现自带策略的抓取框架,现在努力中,你有兴趣加入这个工程吗? 求轻虐,我小白!
https://github.com/intohole/xspider
我想各种解耦爬虫框架,奈何我小白!求各位大神照顾,多关注下,给我点动力 ,谢谢
主要是,为了各种节省资源(文件队列/ bloomfilter 过滤/文件存储),抓取网站使用!
|  |      1lhx2008      2017-12-07 18:00:40 +08:00 via Android 感觉是不是有点为了解耦而解耦的感觉,扩展性也不太好 | 
|      3cheesea      2017-12-07 18:07:08 +08:00 我比较想知道你怎么做限流的? |