如果你想学习 scrapy 爬虫开发,或许它能帮到你

2016-12-06 10:18:15 +08:00
 MichaelYin

如果你想学习 scrapy 爬虫开发,或许它能帮到你

大家好,我是 michael ,现在居住在水电之城宜昌,从事远程开发已经三年多了,主要用 python 进行爬虫开发,数据可视化工具开发。一直以来 python 社区并没有一份比较好的爬虫入门教程,免费的更少,所以我决定来试着解决这个痛点。

这个项目包含

  1. 一份任务列表,这份任务列表包含了爬虫开发过程中的一些基本知识点,每一个任务都是一个小的测验,当你循序渐进的完成了这个任务列表中的任务时,你将有能力面对爬虫实际开发过程中一些更复杂的情况。这个任务列表的创意来自 codekata

  2. 一份爬虫开发过程中的注意事项和笔记,这些笔记能有效提高你的开发效率,还会介绍一些非常有用的工具

项目已经托管在 github, 关于这个项目更多的信息请戳 这里

4480 次点击
所在节点    程序员
19 条回复
lakeview
2016-12-06 10:33:39 +08:00
谢谢,先看看
fengxueshangu
2016-12-06 10:38:06 +08:00
支持一下楼主,公司电脑不能 pip ,安装起来简直要了我老命
pscl
2016-12-06 10:38:40 +08:00
支持,先看看
zhangchioulin
2016-12-06 10:48:00 +08:00
支持支持
KenGe
2016-12-06 11:03:05 +08:00
支持 我先看看 最近在学习
GreatMartial
2016-12-06 11:11:19 +08:00
支持
hebwjb
2016-12-06 11:34:51 +08:00
支持
cankoor
2016-12-06 13:25:13 +08:00
有心,支持!
jingliang
2016-12-06 13:41:31 +08:00
chendajun
2016-12-06 13:53:52 +08:00
有心,兹磁!
fhefh
2016-12-06 14:00:08 +08:00
先 mark
songjiaxin2008
2016-12-06 14:06:34 +08:00
前几天直接学 scrapy 爬了下 javlibrary...这个库很强大,对于错误处理以及存储都很方便,就是感觉文档有的东西不是很新呀,都得自己踩完了才能发现,比如 log 库,以及包引入(contribe)。
ammzen
2016-12-06 14:42:09 +08:00
@songjiaxin2008 分词搞错了,当成 javlibrary 这个库很强大,去搜了一下[掩面而逃(*/ω╲*)]
zhanghaoteng
2016-12-06 16:22:05 +08:00
支持 lz ,感谢
flyingghost
2016-12-06 18:07:29 +08:00
@ammzen javlibrary 这个库很强大毫无破绽啊。😂
publicAdmin
2016-12-06 21:55:26 +08:00
已 fork ,感谢,感谢!🙏
alexapollo
2016-12-06 22:26:39 +08:00
@songjiaxin2008
@flyingghost
你们竟然在这里讨论这么神圣而不可侵犯的库
blaxing
2016-12-06 22:27:36 +08:00
楼主有心了,谢谢您的付出。
zypy333
2016-12-07 13:07:35 +08:00
@songjiaxin2008 我还以为是 java...学习了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/325560

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX