chuansong.me 这网站一直都是采集的微信公众号的文章,这种采集是如何实现的那?采集的来源是哪里那?

2016-09-23 12:21:30 +08:00
 soho176
25435 次点击
所在节点    Python
43 条回复
sunocean
2016-09-23 16:52:51 +08:00
学会一种新思维, 谢谢楼主
Immortal
2016-09-23 16:54:30 +08:00
别跑题啊
我也好奇这块采集怎么处理的
有大牛讲解下么
billytom
2016-09-23 18:33:41 +08:00
@aricch 站长把域名注册人都隐藏了,显然是对此方法可能造成的“法律风险”做了一定的规避
不过三年能做到这种流量,很不错了
billytom
2016-09-23 18:35:13 +08:00
@zixianlei 的确,这种网站闷声赚钱是最好的
bombless
2016-09-23 18:37:51 +08:00
https://github.com/bowenpay/wechat-spider
之前 v 站不是有人分享过他这个项目么
livc
2016-09-23 22:03:40 +08:00
好奇这个网站是手动收录的吗?
shiny
2016-09-23 22:08:23 +08:00
很久以前问过他本人,就是他没透露。 他做的比搜狗的要早。
chiv2
2016-09-23 23:00:21 +08:00
页面上没有广告,流量如何变现?
soho176
2016-09-23 23:50:11 +08:00
@chiv2 醉了 没广告?、你确定?肯定是浏览器有屏蔽插件 吧,一个页面上 好些广告的
VmuTargh
2016-09-23 23:52:28 +08:00
不过我个人觉得这个站不错啊
至少像我这种不用微信的人来说还是很方便的。
soho176
2016-09-23 23:53:20 +08:00
@billytom 的确是发财了 闷声发大财啊
soho176
2016-09-23 23:55:34 +08:00
@sunocean 那么杂感谢我那。。哈
murmur
2016-09-23 23:57:51 +08:00
支持 D 一下 微信公众号盗抄 这个盗抄公众号。。。
adfsadfssfd
2016-09-24 00:47:55 +08:00
垃圾采集站 以偷东西为生
wizardforcel
2016-09-24 08:46:54 +08:00
微信生态封闭,简直是自食其果。
pango
2016-09-24 11:46:46 +08:00
据我所知,早期的一些直接采微信的采集方法均已失效,这个网站可能有内部资源(我不认识作者,纯猜测)。
marcus930
2016-09-25 13:14:19 +08:00
@eightqueen 同感,手机看着太累了,图片加载也慢。
gamecreating
2016-10-04 19:40:11 +08:00
@billytom 看代码 是采集的 http://weixin.sogou.com/ 这似乎不是 chuansong.me 应该是直接采集的 微信数据才对吧
ppyace
2017-08-21 16:57:51 +08:00
仔细研究,发现采集的是 sougou,不多最近数据代码看,看来,他选用每日采集,符合微信最新 10 篇文章规则。
AlwaysBee
2017-09-16 20:39:04 +08:00
之前也做了一款 WordPress 插件一键导入微信文章到网站中,并且突破防盗链,能够把图片下载下来,支持自动同步,如果要采集所有文章提供这样的服务,感兴趣可以搜一下 beepress,http://artizen.me/beepress

现在大部分爬虫都是采集搜狗的,还有一种基于中间人代理去爬取,现在看传送门的文章里面的图片好像都被防盗链弄掉了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/308405

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX