微博、微信公众号现在有什么比较好的爬虫方案吗?

2016-04-06 18:33:20 +08:00
 cqcn1991

想定期爬几个微博号、公众号的数据,做个信息汇总的网站 但是不知道现在微博和公众号的爬取难度如何?

2657 次点击
所在节点    问与答
8 条回复
liaowu
2016-04-06 18:55:30 +08:00
公众号爬搜狗就好了。历史文章都有
cqcn1991
2016-04-06 19:00:36 +08:00
@liaowu 话说有没例子?还是得做 cookies 那种?
zcoder
2016-04-06 19:35:14 +08:00
@cqcn1991 不需要 cookie ,直接从 http://weixin.sogou.com/ 爬取
cqcn1991
2016-04-06 20:14:45 +08:00
dong3580
2016-04-06 20:33:42 +08:00
用 c#上的 webbrower 爬取,不过微博可能翻页会有验证码
vvaaiinn
2016-04-08 18:58:29 +08:00
@cqcn1991 楼主你好、最近也在搞这个、但是水平有限、不知道怎么免过登陆、可否加个联系方式交流交流
cqcn1991
2016-04-08 19:54:49 +08:00
@vvaaiinn 我也是啊...不知道怎么搞....我根本抓不到相关的信息
cqcn1991
2016-05-01 17:55:41 +08:00
@liaowu
@zcoder
@dong3580
已经基本解决了小量的爬取,我自己是 Ruby ,用的 PhantomJS
凑合着用吧...

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/269042

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX