V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
GrahamCloud
V2EX  ›  推广

造数带着新的界面来和大家见面,希望一起思考,拓展易用爬虫的应用场景(附链接)

  •  1
     
  •   GrahamCloud · 2016-11-24 02:34:19 +08:00 · 2627 次点击
    这是一个创建于 2921 天前的主题,其中的信息可能已经有所发展或是发生改变。

    点击参观新的造数

    两周的时间里,造数在大家的批评与建议中获得了很大的成长,这次我们带来了全新的界面,新的功能。升级 ajax 支持组件之后,可以满足基本的数据采集任务,可以简单地抓取,识别各种主流网站的信息。

    爬虫的使用需求越来越高,我们对数据采集的要求也越来越高,爬虫技术与反爬虫技术此消彼长。但是真正简单易用的云爬虫,还没有出现,我们希望可以认真做一个。也期待大家能开心地把玩我们的网站。

    接下来的时间里,造数会继续飞快的改进,与大家一起思考易用爬虫的应用场景,期待能让大家感受与造数一起成长的快乐。请大家有什么需求,建议,一定要告诉我。

    下面是目前的网页操作流程图,如果感觉哪里不合胃口,造数希望可以为你裁剪,为你定制,欢迎私信。

    一,下面是目前造数的基本使用方法,粘贴网址到框内进行分析

    img

    二,分析的步骤

    ( 1 )进入分析页面以后,点选你要的数据,我们自动帮你把同类信息选中。 img

    ( 2 )如图,看到其他同类的价格也被选中,可以进一步选择其他信息。 img

    三,规则设置之后,进入预览界面 img

    四,进入工作台,这里可以管理你的所有任务,决定是否定时抓取,导出文件的格式等等。 img

    目前支持 excel , xml , jason , csv 的各种导出格式,希望你能尽情玩耍。

    点这里造数

    造数团队

    [email protected]

    第 1 条附言  ·  2016-11-24 11:48:27 +08:00
    造数微信号: Zaoshuio
    10 条回复    2016-11-24 16:02:58 +08:00
    a87150
        1
    a87150  
       2016-11-24 03:05:06 +08:00   ❤️ 1
    感觉好难用啊,有没有更进一步的操作。比如爬到 url 之后再抓取这个 url 里面的内容和翻页之类的。
    GrahamCloud
        2
    GrahamCloud  
    OP
       2016-11-24 03:27:33 +08:00
    @a87150 翻页在设置规则里可以用,最近在优化,控制台的定制规则可以稍稍满足你现在的需求。
    binux
        3
    binux  
       2016-11-24 03:30:25 +08:00   ❤️ 1
    对齐还是不对
    GrahamCloud
        4
    GrahamCloud  
    OP
       2016-11-24 11:16:48 +08:00
    @binux 首页的对齐么?求问哪里
    ofblyt
        5
    ofblyt  
       2016-11-24 11:26:26 +08:00   ❤️ 1
    给的两个例子还不错
    570k
        6
    570k  
       2016-11-24 14:25:50 +08:00   ❤️ 1
    注册不了 QQ 邮箱 163 邮箱 都没收到邮件
    GrahamCloud
        7
    GrahamCloud  
    OP
       2016-11-24 14:52:20 +08:00
    @570k 马上解决一下。
    570k
        8
    570k  
       2016-11-24 15:56:51 +08:00   ❤️ 1
    试了下 挺难用的 等下个版本吧
    GrahamCloud
        9
    GrahamCloud  
    OP
       2016-11-24 16:00:39 +08:00
    @570k 感谢杭州的朋友,估计下周还会在上一些功能,现在主要收集需求。
    570k
        10
    570k  
       2016-11-24 16:02:58 +08:00   ❤️ 1
    @GrahamCloud 期待
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   938 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 21:16 · PVG 05:16 · LAX 13:16 · JFK 16:16
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.