先放github 地址。
抓取方式:
模拟登陆微信公众号平台,借此获取需要爬取公众号文章的 url
通过mitmproxy
手机抓包,得到appmsgtoken
和cookie
,爬取文章的阅读数、点赞数及评论信息
不使用模拟登陆,用抓包工具获取相关参数后,直接抓取
有以下问题:
不知道如何使用python
在shell
中显示获取到的二维码,目前使用的方式是用matplotlib
和PIL
显示。
获取微信公众号文章的时候,一次性不能爬取太多,一次最多貌似只能有 30、40 条。
API 设计上可能存在问题
以上,望大佬轻喷,提出意见
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.