知乎上有不少答案和分享是很值得一看的,那么如何能够爬取采集内容呢。
这里有一种很简单的方法和大家分享下:使用现有的已经写好的爬虫。
神箭手云爬虫上就有现成的知乎采集规则,使用方法也很简单。
注册账号-获取规则-建立任务-启动任务,就可以爬取了。
这个爬虫写的很详细,除了回答,还爬取了作者,头像,发布时间,内容的评论等。
神箭手云爬虫链接: http://www.shenjianshou.cn/
知乎的爬虫: http://www.shenjianshou.cn/index.php?r=market/configDetail&pid=20
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.