学爬虫技术应该如何开始?

2015-02-01 23:46:05 +08:00
 ATiGr

有感于爬虫技术的威力 (/t/164359) 我深深地觉得,这是个强有力的工具!所以特别想拥有这样的Super Power。哪怕学习需要的时间久一点,要看很多书也没关系。

我非计算机专业,有的只是十足的兴趣,和一些系统使用方面的知识,对 Linux ,仅仅懂得一些最最基本的命令行操作,但是也没怎么用过。所以,可能需要各位前辈从基础方向开始指导一个方向。需要补的框架知识是什么,最好有一个针对性的书目推荐啥的~

如能得到前辈们的一些指导,定能少绕很多弯路,在此先行谢过!

4685 次点击
所在节点    问与答
9 条回复
Eymard
2015-02-01 23:52:36 +08:00
head first系列 随便看看先有个概念
Doubear
2015-02-01 23:56:38 +08:00
学好python再学爬虫吧
binux
2015-02-01 23:58:00 +08:00
muziyue
2015-02-02 06:00:53 +08:00
html+http协议+python 这个应该最简单了
justjavac
2015-02-02 08:30:40 +08:00
mhycy
2015-02-02 08:57:51 +08:00
把python的第三方包 requests 学会就算入门了
phoeagon
2015-02-02 09:17:36 +08:00
从认识到不要自己写爬虫开始。
em70
2015-02-02 14:01:13 +08:00
先写个最简单的,然后不断完善,抓豆瓣吧
wizardforcel
2015-02-02 14:02:56 +08:00
你先看curl和regex就好。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/167424

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX