老大让爬取微信公众号的历史文章内容和点赞数以及评论,各位 v 友有什么建议吗?

2018-06-13 14:02:03 +08:00
 dapengzhao

1 目前尝试了自己抓包,想通过自己拼接微信数据接口的方式取数据,无奈参数太多,有几个始终无法解析出来。 2 看到 git 上有大佬用中间人攻击的方法直接获取数据包,但是看不懂。

1997 次点击
所在节点    问与答
9 条回复
ooooo
2018-06-13 14:22:10 +08:00
关键词 huginn
airyland
2018-06-13 14:44:32 +08:00
楼上说 huginn 是真的试过的么,如果是要爬搜狗,搜狗是没有点赞数,评论的,历史文章只有 10 条。历史文章页面是微信域的,有严格的 ip 限制。

现在简单可行的就是用 Anyproxy 实现注入 js 脚本来实现爬取了,但是你要有足够多的账号设备,微信封不封你看心情。。
golmic
2018-06-13 16:04:41 +08:00
赞同二楼。直接免费直播讲过微信公众号内容的抓取,录播视频在知识星球:数据
golmic
2018-06-13 16:04:51 +08:00
anyporxy 或者 whistle
golmic
2018-06-13 16:05:03 +08:00
@golmic anyproxy...
dapengzhao
2018-06-13 17:07:55 +08:00
@golmic 好的我去看看学习一下
dapengzhao
2018-06-13 17:13:09 +08:00
@golmic 去了知识星球上面有个搜索框输入了微信,视频,数据,微信视频,微信数据,都返回没有搜到。。。
crab
2018-06-13 17:23:41 +08:00
@dapengzhao 应该说的是公众号 pydatame 里的付费星球
golmic
2018-06-13 17:38:39 +08:00
@dapengzhao #7
@crab #8
知识星球搜 数据 应该有的吧,星球名字叫数据,是付费的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/462778

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX