首先,先看我写的文章,介绍现在微信公众账号可以抓取的方法:
这个工具是纯 node.js 代码,使用 anyproxy 做代理来抓取文章的。
$ npm install wechat_spider -g
具体安装和使用请查看 https://github.com/lijinma/wechat_spider
抓取完存储在 sqlite 中,可以导出 csv ,如图:
<script>setTimeout(function(){window.location.href="下一个 url";},2000);</script>
,动态修改下一个 url ,这样就可以保证一直抓下去。我尽可能的在 README 中尽可能的把每一步都写得非常清楚,希望真的可以对你有用,尤其是媒体工作者,因为我这个工具就是为我一个做媒体的朋友写的,有任何问题,请提 Issue 。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.