360的微信自媒体是怎么抓到数据的,微信似乎没有相关接口啊?

2013-07-19 16:38:13 +08:00
 guiquba
http://wemedia.so.com/index.html 聚合的内容很不错,不知道怎么拿到链接的,有相关接口吗?
7818 次点击
所在节点    问与答
21 条回复
vontio
2013-07-19 16:39:41 +08:00
你怎么知道不是人工编辑的
guiquba
2013-07-19 16:45:58 +08:00
vontio
2013-07-19 16:49:23 +08:00
@guiquba 微信编辑模式-》图文编辑,你弄一个试试
guiquba
2013-07-19 16:51:36 +08:00
@vontio 恩,微信正文页里能得到链接。不过,他们不会真是人工提取的链接吧?当然,他们也确实可以这么做。。。
alexzhan
2013-07-19 16:55:19 +08:00
notedit
2013-07-19 16:56:18 +08:00
我想到一个方法 没试过 你注册一个公共账号 然后把所有的自媒体都关注 当对方给你发消息的时候 你可以通过api解析对方给你发的内容 得到内容的url
laskuma
2013-07-19 17:09:00 +08:00
@alexzhan -_- 360是抓的你这的吗?
alexzhan
2013-07-19 17:14:31 +08:00
@laskuma 从这里抓不到任何微信原始文章的链接。昨天我还发现网页上还有链接的,不过发现之后马上堵死了。
guiquba
2013-07-19 17:19:47 +08:00
@notedit 不是很明白。。公共帐号能关注其他帐号?
ryon
2013-07-19 17:23:44 +08:00
模拟登录抓取的,微信官方天天换策略避开被抓。
vontio
2013-07-19 17:29:44 +08:00
@ryon 模拟登陆 + @notedit 说的方法,关注所有需要抓取的公共主页,模拟登陆,解析。。
laskuma
2013-07-19 17:36:16 +08:00
@alexzhan 有联系方式吗。?我有个方法 不知道跟你用的是不是同一个
guiquba
2013-07-19 17:37:04 +08:00
@vontio 模拟登陆不会。。。有开源相关代码不?
alexzhan
2013-07-19 17:42:25 +08:00
@laskuma 你在微博上跟我说过一次了。。。
laskuma
2013-07-19 17:46:42 +08:00
@alexzhan 我以为你没看见啊
alexzhan
2013-07-19 18:03:12 +08:00
@laskuma 你可以按你的想法去实现一下。
vontio
2013-07-19 18:11:06 +08:00
@guiquba 一般的模拟登陆一搜一大堆,微信是二维码的
vontio
2013-07-19 18:42:57 +08:00
@guiquba 另外一个思路,浏览器先登陆进去,模拟浏览器点击,js抓取到内容后,post到自己的服务器
tt0411
2013-07-19 18:54:08 +08:00
为什么要模拟登陆那么麻烦,开个android虚拟机,设个代理http服务器,想要什么有什么了
imria
2014-03-06 11:05:10 +08:00
@tt0411 没那么简单,有移动端环境,还要对数据解密

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/76319

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX