求一个面向非码农的爬虫入门 Tutorial

2016-02-10 11:04:57 +08:00
 gaocegege
最近身边好多法学啊,经济的同学问能不能学习一下爬虫的姿势,这样以后搜集资料就不需要老是复制粘贴这样的体力劳动了。于是就想来看看有木有符合这样需求的 tutorial ,大家可以 share 一下呢~
5881 次点击
所在节点    程序员
26 条回复
xavierskip
2016-02-10 19:17:09 +08:00
@lemonda 找到了!是 kimono https://www.kimonolabs.com/
sadscv
2016-02-10 19:31:26 +08:00
@xavierskip 这个好 、完全图形化界面。
zacks
2016-02-10 19:50:48 +08:00
同样推荐 pyspider 。可以通过点击网页或者代码进行爬虫。
ctrainr
2016-02-10 20:17:39 +08:00
国内:火车头 八爪鱼;国外 import.io kimono visualscraper datascraping.co parsehub mozenda
wizardforcel
2016-02-10 21:48:58 +08:00
我现在用 node+cheerio ,但是也得懂选择器,它比起 xpath 来说对程序员更友好一点,但是对于非程序员来说还是天坑。

唯一的办法就是做个自动化的工具给他们。
xavierskip
2016-02-16 14:59:06 +08:00
kimono 要关闭他的公共服务了 https://www.kimonolabs.com/


xpath 可以直接在 chrome 浏览器检查元素直接获取, css 选择器或者 xpath 随便生成。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/255972

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX