有什么关于爬虫比较好的入门教程吗?

2019-02-27 17:04:45 +08:00
 xiaozaiziwyt
某东上看了一些比较火的爬虫实战的书,发现不是一堆安装就是教程过时……
看得我是各种头疼,浪费生命。
有没有新一些的,可操作性强的呀。
新手入门求推荐。。。
4780 次点击
所在节点    Python
39 条回复
xiaozaiziwyt
2019-02-28 11:10:33 +08:00
@xpresslink 好的,了解了,不过我是看别人说要先学爬虫在学 Web,因为爬虫是基础🤣
xiaozaiziwyt
2019-02-28 11:13:51 +08:00
@BlackPineappo 这本书好像有些旧,是 17 年的。。。
dswill
2019-02-28 11:28:09 +08:00
我也是初学者,我看了 2.x 版本的基础,又看了 3.x 版本的。 我电脑上安装的是 3.7 版本的 python, 发现有很多旧版本的代码运行不了,不过这些运行不了的代码查下资料,就可以发现问题所在,所以就算是旧书籍,也可以学习,只是问题会多一些,但找问题解决也是一个学习过程。
dswill
2019-02-28 11:28:55 +08:00
书籍的话,我都是找社区或者学习群找前辈要的。
dongya
2019-02-28 11:29:43 +08:00
@xkeyideal 我真是人在家中坐, 锅从天上来,
jianzhao123
2019-02-28 14:38:20 +08:00
@dswill 老哥能分享下不能:)
locoz
2019-02-28 15:40:08 +08:00
8 楼说的很对, 现在很多的教程 /书籍都是讲的那些基本操作,而真正碰到问题时用来解决问题的干货却很少,如果你想要入门的话还是实际爬点东西比较好。
打个小广告,可以关注一下我的知乎专栏《手把手教你写爬虫》 https://zhuanlan.zhihu.com/webspider,会发一些你平常看不到的干货,虽然没啥空闲时间码字,更新会比较慢
locoz
2019-02-28 15:40:43 +08:00
@locoz #27 后面那部分也给识别成链接的一部分了,重发一下。https://zhuanlan.zhihu.com/webspider
BlackPineappo
2019-02-28 15:49:35 +08:00
@xiaozaiziwyt 17 年还算旧?爬虫入门都是那些,代码能运行,原理都一样。
jalena
2019-02-28 15:53:38 +08:00
xiaozaiziwyt
2019-02-28 20:38:17 +08:00
@dswill 知道了,那你主要学习的那些有名称吗? 我去看看
dswill
2019-03-01 16:05:26 +08:00
@jianzhao123
@xiaozaiziwyt
链接: https://pan.baidu.com/s/1bg0lKloSzqrldkPnX4FfuA 提取码: 4h23
这是我有的一些书籍,也比较杂,不过好像没有爬虫的。
xiaozaiziwyt
2019-03-01 16:19:30 +08:00
@dswill 谢谢,请问你现在 py 学到哪个地步了?
dswill
2019-03-01 16:34:40 +08:00
@xiaozaiziwyt 我还没工作上实践过,都自己拿书敲一敲代码。 算个菜鸟级,具体什么地步,我也不清楚,起码你让我完成工作上的任务,还得有人带带才行,我想爬虫我是不是也可以学一学。 我还找朋友一起学,倒是有个伙伴,这点挺好,你如果有朋友也可以一起共勉。
Pzqqt
2019-03-01 21:06:37 +08:00
建议阅读《 Python 网络数据采集》
从 HTML 解析到 API 调用 从存取数据到 JavaScript 简介 从读取文档到 OCR 循序渐进 非常适合零基础接触爬虫的群众
看过其他那些些市面上已有的 Python 爬虫教程书籍 但这些书籍设计的起点都比较高 并不适合想学习爬虫的群众去看
PS:只是写一些简单的爬虫的话 用好 requests 库和 BeautifulSoup4 库就可以了 不要盲目跟风上来就接触 Scrapy 这种比较高级的库
xiaozaiziwyt
2019-03-01 23:26:32 +08:00
@Pzqqt 这本书是只看原理就好了吗?因为书的内容有些旧
Pzqqt
2019-03-02 19:14:04 +08:00
@xiaozaiziwyt 哪里旧了。。。我是在阅读完《 Python 入门到实践》学习了 Python 基础之后再阅读这本书的 阅读起来没有什么障碍 也没有发现内容有什么过时的地方 如果你的起点比较高对入门类书籍不屑一顾的话那当我没说
darknoll
2019-03-04 09:54:42 +08:00
@jalena 胆真肥,不怕抓起来坐牢啊
273579540
2020-10-06 08:01:11 +08:00
www.learnfk.com/course-php7 PHP7 教程地址

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/539334

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX