想用 python 采集自己朋友圈的图片,不知道有没有什么思路可以实现呢?

2016-10-21 19:34:53 +08:00
 kxboy
我有个微信号,加了很多有上百个微商,每天朋友圈会有很多产品图片刷屏,偶尔会让人有眼前一亮的产品,但是实在没功夫天天盯着朋友圈刷微商图片,重复率极高,看多了真的会吐。想着能不能用 python 写个爬虫,把图片采集下来,然后图片去重,然后这些图片也可以算是一笔资源。对 python 的掌握程度,基本上能实现网页的爬虫功能,但是不了解朋友圈怎么爬取。
13184 次点击
所在节点    Python
29 条回复
cheetah
2016-10-21 19:38:33 +08:00
模拟登录
kxboy
2016-10-21 19:41:36 +08:00
@cheetah 网页微信不是需要扫码登录么?同样可以模拟登陆么?我只知道可以模拟表单登陆。
karenn
2016-10-21 19:41:50 +08:00
抓包,分析接口,然后模拟请求
tumbzzc
2016-10-21 20:52:34 +08:00
本帖的回复都是屁话,包括本回复
kwanhur
2016-10-21 23:29:40 +08:00
0 、用 replica 截取 APP 对外的请求
1 、导出 session log
2 、根据 log 的请求类型&&URL 爬取图片
em70
2016-10-22 00:15:43 +08:00
你的朋友圈不是一个公开数据,不能直接爬取,必须模拟登陆.

有个其他的思路,用电脑做一个 wifi 热点,手机连上查看朋友圈,然后在电脑上抓包手机的请求日志,从中把图片地址都分析出来.
lhx2008
2016-10-22 00:26:44 +08:00
模拟登陆不现实,微信没有给接口,网页版又没有朋友圈。在网络传输时截取数据是比较好的方法,但是全自动又有点难
scnace
2016-10-22 00:51:20 +08:00
话说 我也想做个 feature 把自己朋友圈的内容导出 但是嫌太麻烦 已经搁置挺久的了😂
Asimov
2016-10-22 02:49:30 +08:00
试试手机上的按键精灵
congeec
2016-10-22 03:09:33 +08:00
不知道传输的时候有没有加密。加密的话,逆向 app , hook 获取朋友圈内容的函数
orange88
2016-10-22 08:14:04 +08:00
itchat 应该行
kindjeff
2016-10-22 08:24:08 +08:00
我建议用按键精灵点安卓模拟器
NxnXgpuPSfsIT
2016-10-22 09:00:22 +08:00
@orange88 非常感谢你的支持!但 itchat 实际不包含朋友圈的 api ,关于朋友圈的抓取还是建议阅读其他的回复。
1130335361
2016-10-22 09:26:48 +08:00
所以我一直在想微信书( https://weixinshu.com/)是如何实现的
ctsed
2016-10-22 09:53:40 +08:00
告诉微商自己喜欢什么 帮你留意一下
ytmsdy
2016-10-22 10:10:11 +08:00
用 fiddler 伪造证书,抓微信客户端的通信数据。手机模拟器里面不停的刷新朋友圈, fiddler 监控数据流,如果是图片就保留下来。
est
2016-10-22 10:17:54 +08:00
根用什么语言没关系。
lovesky
2016-10-22 11:14:59 +08:00
不用抓包, 用 Xposed 就可以搞定. 已有导出朋友圈的插件, 直接使用就可以.
xssing
2016-10-22 16:31:15 +08:00
抓妹子照片,又想去除微商。怎么搞
fchypzero
2016-10-22 16:58:21 +08:00
@1130335361 参考使用说明 https://xinshu.me/reading/books/e90846f49151/articles/b4f8a772519aad
估计用的是魔改的客户端,对接自己的服务器做的一个服务,类似 xposed 的那种。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/314500

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX