微信公众号的内容怎么获取?

2014-11-06 10:16:14 +08:00
 deben
www.chuansongme.com

这个站点里面的文章是怎么采集到的呢?
已知的方法是去搜狗搜索然后获取,但是如果大量的请求,搜索不会把IP干掉吗?

好好奇……
3450 次点击
所在节点    程序员
6 条回复
xmvagrant
2014-11-06 13:43:57 +08:00
这个网站建立得比搜狗微信搜索早。我觉得有可能是破解了客户端和服务器的通信协议。
cooiky
2014-11-06 14:48:38 +08:00
最初这个站说过,好像是直接看每篇文章的 URL
deben
2014-11-06 15:43:16 +08:00
@xmvagrant 这么 NB ????
@cooiky 直接看?人工?还是破解个 Android 或者 IOS 的微信客户端的东西……
cooiky
2014-11-06 19:50:15 +08:00
可以找个号的文章 URL 看下,里面记得是有个 ID 的,好像是连续的
colorday
2014-11-07 09:20:18 +08:00
deben
2014-11-07 09:21:22 +08:00
@colorday 这个方法可行,但是如果定时器密集的去查找,IP会进黑名单吧。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/144323

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX