搞 了个微信文章爬虫

2017-04-17 21:52:44 +08:00
 xjp

Weixin Article Convertor

接口非常简单 就一个参数 传入微信文章的链接即可 然后稍微用表单封装了一个界面 比较丑 主要是接口能用

直接获取纯 HTML+CSS 的内容 把所有 script 相关的都清理了 还有一些多余的标签属性

3002 次点击
所在节点    分享发现
9 条回复
graetdk
2017-04-17 22:11:13 +08:00
要是能爬到阅读点赞就好了
zhangsimon
2017-04-17 22:15:38 +08:00
我想看某个公众号的历史阅读曲线=。=
好分析下公众号是在哪些环节爆发的
airyland
2017-04-17 22:45:56 +08:00
你这叫文章内容解析不叫爬虫。。
Gantz
2017-04-17 22:47:08 +08:00
El. innertext 不就行了?
akmonde
2017-04-18 09:00:14 +08:00
@zhangsimon 觉得这类分析挺有意思的。
globetour
2017-04-18 09:06:58 +08:00
@airyland 赞成,楼主能研究出爬取文章链接才行
vvaaiinn
2017-04-18 13:30:40 +08:00
@zhangsimon 然后呢,怎么应用?
手头有数据,但是不会玩。
求指导。
macwhirr
2017-04-18 15:26:29 +08:00
我直接打开文章看好不好…
gamecreating
2017-04-18 16:09:10 +08:00
weiwenmao.com ..不会 Web 将就看吧...可以爬点赞阅读数. 评论等.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/355487

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX