开始在简书上写 Python 爬虫系列文章

2017-04-01 09:34:57 +08:00
 wisefree

第一篇: http://www.jianshu.com/p/11d7da95c3ca

这一系列文章不写复杂的爬虫,而是将复杂的爬虫涉及到的核心知识点写清楚

  1. 代理池(高匿)

  2. 多进程

  3. 正则表达式

  4. 数据库

  5. selenuim

  6. 手机抓包

  7. ....

希望 V 友能提提建议,能投稿就更好了

11329 次点击
所在节点    Python
82 条回复
wisefree
2017-04-01 11:50:40 +08:00
@BoBoy 好的,一起来玩哈
ykwlv
2017-04-01 11:53:44 +08:00
想看代理池的部分,什么时候更新呢?
ansheng
2017-04-01 11:54:02 +08:00
@wisefree 拥抱 Python3

@polebug thx
wisefree
2017-04-01 11:59:18 +08:00
@ykwlv 这个更新的具体时间未定,代理池相关文章应该会放在正则之后
wisefree
2017-04-01 12:03:21 +08:00
@ansheng 我一直学的就是 Python3 ,虽然看了一些视频教程( Python2 ),但是里面的代码我全部用 Python3 实现,:)
wisefree
2017-04-01 12:30:17 +08:00
@ansheng 对了,有兴趣写写 Python 爬虫的文章么?:)
zuosiruan
2017-04-01 12:31:44 +08:00
@ansheng
ansheng
2017-04-01 13:04:42 +08:00
@wisefree 正在学- -。
xiaoke0718
2017-04-01 13:07:06 +08:00
你都会了 py 技术?
wisefree
2017-04-01 13:07:50 +08:00
@ansheng 正需要这些新鲜的知识,欢迎投稿,:)
wisefree
2017-04-01 13:10:06 +08:00
@xiaoke0718 我爬取过高考吧 200 多万条记录,用里上面写大部分技术,爬网易云课堂评论的时候用过 selenium
http://www.jianshu.com/p/8893973b279c
虽然代码写的不漂亮,但是能干活。
xzpjerry731
2017-04-01 13:22:19 +08:00
能顺手同步到 github 上吗,感觉 github 看 md 文件挺好的
liyuhang
2017-04-01 13:25:41 +08:00
anexplore
2017-04-01 13:26:55 +08:00
爬虫已经成功了程序员必备技能了
wisefree
2017-04-01 13:27:17 +08:00
@xzpjerry731 谢谢提建议,暂时不打算到 github 维护文章,因为要写毕业论文,:(
wisefree
2017-04-01 13:28:56 +08:00
@anexplore 也不一定,我寝室一个哥们转行 java ,让他写爬虫,死活不写,还是看个人兴趣。。:)
Or2
2017-04-01 14:37:14 +08:00
一定要来几个高级爬虫的例子!
wisefree
2017-04-01 14:56:58 +08:00
@Or2 水到渠成的时候,可能会写的。如果把这些知识点写完,只要结合几个知识点,那么就可以写出高级爬虫的例子了,:)
cheese
2017-04-01 16:02:30 +08:00
思考题一有个错别字,网页写成了网易
wisefree
2017-04-01 16:08:29 +08:00
@cheese 已经更正,文章第一行有更新信息,加了你的 V2EX 主页链接,如果可能对你造成影响,请告诉我,我立即清除

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/351900

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX