ATiGr
V2EX  ›  问与答

学爬虫技术应该如何开始?

  •  
  •   ATiGr · Feb 1, 2015 · 5287 views
    This topic created in 4142 days ago, the information mentioned may be changed or developed.

    有感于爬虫技术的威力 (/t/164359) 我深深地觉得,这是个强有力的工具!所以特别想拥有这样的Super Power。哪怕学习需要的时间久一点,要看很多书也没关系。

    我非计算机专业,有的只是十足的兴趣,和一些系统使用方面的知识,对 Linux ,仅仅懂得一些最最基本的命令行操作,但是也没怎么用过。所以,可能需要各位前辈从基础方向开始指导一个方向。需要补的框架知识是什么,最好有一个针对性的书目推荐啥的~

    如能得到前辈们的一些指导,定能少绕很多弯路,在此先行谢过!

    9 replies    2015-02-02 14:02:56 +08:00
    Eymard
        1
    Eymard  
       Feb 1, 2015
    head first系列 随便看看先有个概念
    muziyue
        4
    muziyue  
       Feb 2, 2015
    html+http协议+python 这个应该最简单了
    justjavac
        5
    justjavac  
       Feb 2, 2015
    mhycy
        6
    mhycy  
       Feb 2, 2015
    把python的第三方包 requests 学会就算入门了
    phoeagon
        7
    phoeagon  
       Feb 2, 2015
    从认识到不要自己写爬虫开始。
    em70
        8
    em70  
       Feb 2, 2015 via Android
    先写个最简单的,然后不断完善,抓豆瓣吧
    wizardforcel
        9
    wizardforcel  
       Feb 2, 2015
    你先看curl和regex就好。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2847 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 42ms · UTC 14:44 · PVG 22:44 · LAX 07:44 · JFK 10:44
    ♥ Do have faith in what you're doing.