大佬们, http://chuansong.me/ 传送门,这个网站是怎么爬取到最新的公众号文章的?

2018-01-04 20:43:37 +08:00
 woscaizi
搜狗微信搜索是做了反扒的,求解。
3537 次点击
所在节点    程序员
15 条回复
forestyuan
2018-01-04 20:54:58 +08:00
是公众号作者自己提交的,可能微信有接口取数据吧
mcfog
2018-01-04 20:55:56 +08:00
搜微信群控
so1n
2018-01-04 21:09:20 +08:00
可能用一个自己的微信小号关注后,自动获取把
F1024
2018-01-04 21:24:59 +08:00
微信网页版 抓个文章不是轻轻松松吗
oonnnoo
2018-01-04 21:43:21 +08:00
直接爬它就好啦~
F1024
2018-01-04 21:54:49 +08:00
我又看了下 搜狗微信可以直接爬 打开源码就能找到相应信息 应该没什么反爬
woscaizi
2018-01-04 21:58:32 +08:00
@F1024
试试一次打开多篇文章,会弹验证码的
caomu
2018-01-04 22:00:04 +08:00
谢谢 lz,原来已经恢复更新了啊。
woscaizi
2018-01-04 22:03:22 +08:00
爬到的数据包含阅读数,点赞数。
所以数据来源应该和搜狗微信无关了。
通过微信小号关注公众号然后爬取文章这个方法非常有可能。
F1024
2018-01-04 22:14:46 +08:00
验证码 只弹出一次 后面我猛打开十几篇也没出现验证码了
AlwaysBee
2018-01-04 22:17:48 +08:00
这个网站已经被卖了
iyaozhen
2018-01-04 23:39:48 +08:00
这个网站很久远了。还没有搜狗微信搜索的时候就有了。估计还是客户端抓取的
angith
2018-01-04 23:42:43 +08:00
这个站去年 不 前年的时候还比较火的 我还找站长加了我的公众号的
wzwwzw
2018-01-04 23:47:08 +08:00
搜狗微信好像也只能爬取十条的吧。
remenbo
2018-01-05 00:17:22 +08:00
被卖了多少钱啊 现在还是更新得很大

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/420148

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX