两周的时间里,造数在大家的批评与建议中获得了很大的成长,这次我们带来了全新的界面,新的功能。升级 ajax 支持组件之后,可以满足基本的数据采集任务,可以简单地抓取,识别各种主流网站的信息。
爬虫的使用需求越来越高,我们对数据采集的要求也越来越高,爬虫技术与反爬虫技术此消彼长。但是真正简单易用的云爬虫,还没有出现,我们希望可以认真做一个。也期待大家能开心地把玩我们的网站。
接下来的时间里,造数会继续飞快的改进,与大家一起思考易用爬虫的应用场景,期待能让大家感受与造数一起成长的快乐。请大家有什么需求,建议,一定要告诉我。
下面是目前的网页操作流程图,如果感觉哪里不合胃口,造数希望可以为你裁剪,为你定制,欢迎私信。
一,下面是目前造数的基本使用方法,粘贴网址到框内进行分析
二,分析的步骤
( 1 )进入分析页面以后,点选你要的数据,我们自动帮你把同类信息选中。
( 2 )如图,看到其他同类的价格也被选中,可以进一步选择其他信息。
三,规则设置之后,进入预览界面
四,进入工作台,这里可以管理你的所有任务,决定是否定时抓取,导出文件的格式等等。
目前支持 excel , xml , jason , csv 的各种导出格式,希望你能尽情玩耍。
造数团队
grahamcloud@zaoshu.io
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.